niedziela, 11 czerwca 2017

O tym, że nie można rozróżnić formatu stratnego od bezstratnego i o tym, kiedy można.

Pliki stratne są nie do odróżnienia od oryginałów od pewnej przepływności. Można znaleźć artykuły, które sugerują pewne graniczne wartości. Podaje się, że format mp2 od 192 kb/s jest nie do odróżnienia od oryginału przez większość słuchaczy, natomiast AAC i mp3 od 128 kb/s.

Praca nad mp3 wydawała się skończona, kiedy oryginał był już nie do odróżnienia od mp3. A jednak to co było nie do odróżnienia różniło się.*)

Można przyjąć, że opracowywanie formatu mp3 nie odbywało się w przypadkowych warunkach. Używano znormalizowanego systemu odsłuchowego. Wybrano głośniki i pomieszczenie, które musiało mieć określone właściwości akustyczne.

Jeśli słucha się w pomieszczeniu o przeciętnych właściwościach dźwięk jest inny niż w lepszych lub w gorszych warunkach akustycznych. W lepszych warunkach charakterystyka częstotliwościowa będzie bardziej wyrównana i na odwrót.

Im gorsze warunki odsłuchu, tym charakterystyka jest bardziej rozchwiana. Pewne częstotliwości są mocno wzmacniane inne mocno tłumione. Można powiedzieć, że faktycznie słyszy się tylko to, co zostało wzmocnione, a częstotliwości osłabione są słabo lub w ogóle niesłyszane, gdyż są maskowane przez te głośniejsze.

Załóżmy, że w słabym akustycznie pomieszczeniu połowa częstotliwości jest wzmocniona, a połowa stłumiona i zasadniczo słyszymy tylko te wzmocnione. Czyli zakładając, że słyszy się połowę, dźwięk jest w jakimś sensie "odchudzony i przerzedzony". Mamy mniejszą ilość informacji do przetworzenia.

Skoro informacji jest połowa można przyjąć, że będą one lepiej analizowane. Usłyszymy więcej szczegółów z tego, co pozostało, a więc również więcej artefaktów kompresji, przy czym dotyczy to plików o małej przepływności lub przygotowanych nieprofesjonalnie.

Wobec tego w gorszych warunkach słyszy się mniej w ogóle, ale więcej szczegółów z tego co pozostało.


Rysunek pokazuje schematycznie możliwe nakładanie się na siebie stref z wyciętym dźwiękiem w formacie stratnym na podbicia głośności powodowane przez akustykę pomieszczenia. W takim przypadku muzyka będzie słyszana ciszej, artefakty zaś głośniej i dlatego mogą być zauważone. Schemat dotyczy teoretycznej możliwości nakładania się na siebie elementów akustyki i kompresji w wybranym wąskim przedziale częstotliwości. W rzeczywistości taki układ może się zdarzyć i zdarza się, co potwierdza fakt, że w niektórych pomieszczeniach, słychać skutki kompresji, w innych nie. W poprzednim wpisie jest wyjaśnienie dlaczego tego typu reprezentacja graficzna jest niepoprawna i może służyć tylko jako ilustracja pewnej koncepcji.

Następny wniosek jest taki, że w paradoksalny sposób złe pomieszczenie wymaga lepszej jakości dźwięku niż gorsze.

Najtrudniej jest odróżnić format stratny słuchając przez dobre słuchawki. Coś zupełnie zaskakującego z czym mało kto się zgodzi, bo dobre słuchawki uważa się za najlepsze narzędzie do wyłapywania niedoskonałości.

Odwrotnie, łatwiej jest wychwycić artefakty kompresji używając kolumn, które podkreślają zakres, który najlepiej słyszymy w połączeniu ze złą akustyką.

Ciekawe jest również to, że wzmacniacz o słabej jakości i słyszalnych zniekształceniach również, w moim odczuciu, pozwala łatwiej wyłapać artefakty kompresji niż dobry.

Wyeliminowanie pierwszych odbić i skrócenie czasu pogłosu bardzo poprawia jakość dźwięku. Okazuje się, że w lepszej niż typowa akustyce nawet audycje o jakości pozostawiającej wiele do życzenia brzmią w sposób możliwy do zaakceptowania.

Wobec tego jeśli często się słucha dźwięku o gorszej jakości - radio i telewizja oraz pliki o nieznanym pochodzeniu - najprostszym sposobem na poprawę komfortu jest użycie zrównoważonych tonalnie słuchawek lub poprawienie właściwości pomieszczenia odsłuchowego i użycie bardziej liniowych głośników.

*) Ten wpis nie sugeruje, że odróżnienie pliku w formacie stratnym w rozsądnej przepływności od oryginału jest jednak możliwe, bo to jest niemożliwe.