poniedziałek, 29 lutego 2016

Cyfra vs. analog

Wciąż trwa spór pomiędzy zwolennikami dźwięku analogowego i cyfrowego. Zapis analogowy nie ma żadnych zalet w porównaniu z cyfrowym, ale próbuje się używać argumentów ideologicznych, które nie mają sensu, albo wręcz przeinacza fakty. Klasyczny przykład.





Na powyższym schemacie jest przedstawiony sposób konwersji sygnału analogowego do cyfrowego i z powrotem do analogowego. Sygnał źródłowy jest identyczny z wyjściowym. Wprawdzie trzeci etap jest tym zawierającym schodki, ale to jest etap przejściowy. Na wyjściu DAC ma filtr dolnoprzepustowy, który odfiltrowuje schodki powstałe w przetworniku. Zasada jest prosta: jest filtr, nie ma schodków. I nie ma takiej opcji, że brakuje filtra.

Można te rzeczy, czyli idealne odwzorowanie sygnału na wyjściu odtwarzacza CD, zaobserwować na filmie. Dodatkowo jest porównanie winyl/CD.





Sygnał z CD jest czysty i doskonały, natomiast ten z winyla jest bardzo mocno obciążony zniekształceniami i zakłóceniami. Zresztą wystarczy włączyć sobie jakąś dobrze nagraną, tzn. nie obarczoną skutkami Loudness War lub błędami realizatora płytę kompaktową i przekonać się, że dźwięk jest krystalicznie czysty. I zawsze taki będzie, natomiast winyl nawet po jednokrotnym odtworzeniu starą igłą może nadawać się do wyrzucenia.

Bardzo często igła staje się rylcem. Każdy posiadacz płyt winylowych ma takie zniszczone egzemplarze. Nie trzeba ich słuchać, żeby się przekonać, że są zdarte. Wystarczy popatrzyć jak płyta wygląda w dobrym oświetleniu. Jeżeli zapis na winylu jest białawy znaczy, że płyty nawet nie warto kłaść na talerz gramofonu. Płata była odtwarzana tak wiele razy, albo tak mało razy, ale uszkodzoną igłą, że winyl uległ zmatowieniu.


A jednak są ludzie, którzy winyle kupują. Może wolą winyle, bo są drogie, niewygodne w użytkowaniu i mają słabą jakość dźwięku?

wtorek, 23 lutego 2016

Pomiary jakości odsłuchu głośnikowego Hi-Fi

Transmisja dźwięku w powietrzu i jej wysoka jakość stoją w sprzeczności. Proponuję zastanowić się nad sposobem pomiaru jakości dźwięku zestawu Hi-Fi, ponieważ istniejące metody są zupełnie nieprzydatne do określenia wierności dźwięku.

Pomiary jakości są zupełnie oderwane od realiów i nie uwzględniają najbardziej istotnego elementu wpływającego na jakość odbioru, a mianowicie oddziaływania pomieszczenia. Informacje zawarte w danych pomiarowych wzmacniacza lub źródła dźwięku tzn. np. odtwarzacza CD nie mają żadnego znaczenia dla faktycznej jakości odsłuchu. Wszystkie niedoskonałości sprzętu grającego, z wyjątkiem głośników, od dziesięcioleci są tak małe, że całkowicie niemożliwe do wykrycia przez słuch. Jednak branża audio skupia się na nich, najwidoczniej po to, żeby odwrócić uwagę nabywców od istotnych problemów.

Jeżeli jakieś pomieszczenie odsłuchowe ma RT60 wynoszący 0,5 sekundy, to znaczy, że po ustaniu dźwięku i upłynięciu czasu 0,5 sekundy odbicia  osiągną poziom 60 dB niższy od głośności dźwięku źródłowego. Można powiedzieć, że po tym czasie odstęp od zakłóceń wyniesie 60 dB. Jednak to błędne rozumowanie, bo muzyka nie składa się z elementów granych w jakichś odstępach, lecz jest procesem ciągłym. Wobec tego odstęp od zakłóceń nigdy nie będzie lepszy niż 60 dB, natomiast faktycznie może być  zerowy lub jeszcze gorszy.

Jeśli słuchacz usiądzie w strefie dalekiego odsłuchu, gdzie odbić jest więcej niż dźwięku bezpośredniego, odstęp od zakłóceń będzie parametrem bezsensownym, gdyż raczej należałoby określić jaki jest odstęp zakłóceń od sygnału.

Zjawiska akustyczne towarzyszące odtwarzaniu dźwięku w zamkniętym niewielkim pomieszczeniu są dość złożone. Wiadomo, że dźwięk po kilkuset odbiciach od podłogi, sufitu i ścian stanie się szumem. Pomijamy więc odbicia wczesne, późne, pogłos i wynikające z nich zniekształcenia i zakładamy, że jedynym problemem, który obniża jakość odsłuchu jest szum.

Zaledwie kilka parametrów określa jakość dźwięku.

1. Liniowość charakterystyki częstotliwościowej określająca także pasmo przenoszenia.
2. Zniekształcenia nieliniowe takie jak zniekształcenia harmoniczne, intermodulacyjne itd.
3. Odstęp od szumu.
4. Zniekształcenia czasu tzn. jitter i kołysanie dźwięku dla źródeł analogowych jak płyta LP lub magnetofon.

Kołysanie dźwięku czy jitter mogą być mierzone tradycyjnie, tak jak to się robi teraz, jednak pozostałe parametry muszą być mierzone inaczej, tak by uwzględniały faktyczną jakość. Wobec tego jakość dźwięku nie polega na tym jakie parametry ma sprzęt, ale co słyszy odbiorca. Jakość dźwięku może być określona tak naprawdę tylko i wyłącznie dla danego pomieszczenia, konkretnego ustawienia i pozycji słuchacza.

Nie ma znaczenia, że w warunkach laboratoryjnych i w modelowym pomieszczeniu odsłuchowym można uzyskać parametry idealne, ważne jest konkretne pomieszczenie u konkretnej osoby. Parametry w idealnym pomieszczeniu będą idealne. Ale nie słuchamy w idealnych warunkach i rezultaty nie są tak dobre. W realnym pomieszczeniu osiągnie się realną jakość i tą jakość trzeba mierzyć.

Dla przykładu wspomnianego wcześniej, kiedy szum jest znacznie niższy w pomieszczeniu odsłuchowym graficzne przedstawienie tematu będzie wyglądać następująco.


Od góry widać: sygnał użyteczny, szum pomieszczenia oraz to,co odbiera użytkownik. Przy czym na rysunku są proporcje raczej rzadko spotykane w warunkach domowych. Aby schemat był realny, zakłócenia powinny być tak samo silne jak sygnał użyteczny lub większe.

O ile  z pomiarów, które przedstawiają nam producenci sprzętu audio wynika, że jego zniekształcenia są minimalne i gwarantują osiągnięcie idealnej jakości, po dodaniu zakłóceń z pomieszczenia uzyskujemy realną jakość odsłuchu.

Konieczne jest określenie parametrów pomieszczenia odsłuchowego, które umożliwiają dobrą jakość odbioru. Musi zostać określona siła pierwszych odbić, stopień ich podbarwienia i czas pogłosu. Obecnie nie mamy żadnych norm i metod pomiaru realnej jakości odsłuchu.

niedziela, 21 lutego 2016

Wysoka wierność reprodukcji dźwięku jest trudna do uzyskania przy odsłuchu głośnikowym

Podział stref odsłuchu. Wyróżnia się strefę bliskiego pola, średnią i daleką.



Strefa bliskiego pola charakteryzuje się tym, że dominuje w niej dźwięk bezpośredni. Strefa pośrednia, rozproszona, znajduje się dalej i zawiera mieszankę dźwięku bezpośredniego i odbitego. Kolejna jest strefa daleka, w której dominują odbicia.

Inżynier dźwięku powinien się znaleźć w polu bliskim, gdyż tam są najlepsze warunki odsłuchu. W typowych okolicznościach do których zalicza się warunki domowe najczęściej znajdujemy się w strefie pośredniej. Osoby świadomie słuchające muzyki będą dążyć do przesunięcia się w pole bliskie.

Strefa pośrednia charakteryzuje się także tym, że można w niej wyróżnić miejsce określane jako dystans krytyczny. Jest to odległość od źródła dźwięku, w którym ilość dźwięku bezpośredniego i odbitego jest identyczna. Dystans krytyczny wylicza się według wzoru:




gdzie gamma  jest stopniem kierunkowości źródła - gamma równa jeden odpowiada źródłu wielokierunkowemu - A jest współczynnikiem pochłaniania przez powierzchnie, V jest objętością pomieszczenia w metrach sześciennych, natomiast TR60 jest czasem pogłosu w sekundach. Ten ostatni korzysta z przybliżenia Sabine'a na wzór pogłosu RT60=V/6A.

Pomijając w którym miejscu jest dystans krytyczny powinniśmy sobie zdawać sprawę z tego, że z punktu widzenia techniki pomiarowej, proporcje 50% dźwięku bezpośredniego i 50% dźwięku odbitego należy traktować jako 100% zniekształceń.

Słuchając przez głośniki nie ma w ogóle opcji usłyszenia tego co gra głośnik w sposób czysty. Nawet siadając bardzo blisko dźwięk będzie zniekształcony dlatego, że zawsze się wymiesza z występującymi w pomieszczeniu odbiciami.

sobota, 13 lutego 2016

Dźwięk bezpośredni to 1/10 jednego procenta

Odtwarzając muzykę zaledwie jedną dziesiątą procenta jest dźwięk docierający do nas bezpośrednio z głośników. W jaki sposób sprawdzić jak wyglądają proporcje dźwięku bezpośredniego i odbić?

Załóżmy, że głośnik jest ustawiony w odległości 4,5 metra od słuchacza i stoi na ziemi. Dźwięk rozchodzi się jako kula o ile propagacji nie ograniczają specyficzne warunki, jak w tym przypadku - lokalizacja źródła dźwięku na ziemi. W związku z tym w odległości 4,5 metra fala dźwiękowa będzie mieć kształt półkuli o powierzchni około 125 metrów kwadratowych. Ucho zbiera dźwięk z mniej więcej 2,5 cala kwadratowego. Dlatego proporcje dźwięku bezpośredniego, który usłyszymy do całości dźwięku wyemitowanego przez głośnik będą się przedstawiać jak 12,5 cm² do 39 m² czyli 0,125/125=0,001 tzn. 0,1% czyli 1/10 jednego procenta.

Słyszymy zaledwie niewielki ułamek tego, co chcemy usłyszeć, bo raczej interesuje nas dźwięk muzyki z głośnika, a nie odbicia. Co stanie się z tymi 99,99% dźwięku wyemitowanego przez źródło? Wróci on po, wielokrotnym, odbiciu się od podłogi, ścian i sufitu.


Wobec tego można sobie uzmysłowić realne warunki transmisji dźwięku w typowych warunkach.

Można podejść do zagadnienia jakości transmisji w inny sposób. W tym celu należy porównać powierzchnię źródła dźwięku z powierzchnią, która powoduje zakłócenia w postaci odbić, pogłosu, etc. czyli powierzchnią podłogi, sufitu i ścian. Trudność polega na tym w jaki sposób obliczymy pole powierzchni odbijającej dźwięk. Sprawa wydaje się oczywista, ale taka nie jest. Wydawać by się mogło, że pole powierzchni odbijającej dźwięk równa się polu podłogi, sufitu i ścian. Przykładowo pokój o wymiarach 5x4x3 metry ma łączną powierzchnię 94 metry kwadratowe. Wobec tego proporcje membrana/pokój miałyby się jak 0,3 metra kwadratowego; zbliżoną powierzchnię mają głośniki w monitorach; do 94 m.kw. Jednak jeśli głośnik wyemituje tylko jeden impuls, to powierzchnie w pomieszczeniu odbiją ten impuls wielokrotnie. Wobec powyższego powierzchnia pomieszczenia staje się za każdym odbiciem/powtórzeniem impulsu nowym źródłem dźwięku i dlatego należy je wszystkie zsumować.

Jeżeli pomieszczenie ma RT60 wynoszący 0,5 sekundy, fala w czasie 1/2 sekundy pokona łączny dystans 170 metrów. Gdybyśmy wzięli pod uwagę wyłącznie odbicia wzdłuż osi pomieszczenia, zupełnie ignorując odbicia po skosach, których jest najwięcej okaże się, że wzdłuż najkrótszej osi dźwięk odbije się 55 razy, wzdłuż krótszej ściany 40 razy, a wzdłuż dłuższej 35 razy, co da nam łącznie 120 powtórzeń. Trzeba podkreślić, że bierzemy pod uwagę czas RT60 a zatem nie liczymy refleksów cichszych niż 60 dB w odniesieniu do głośności impulsu początkowego. Gdyby i je doliczyć mielibyśmy powtórzeń znacznie więcej.

Wobec tego do uszu względnie mikrofonu pomiarowego dotrze dźwięk bezpośredni i następujące po nim 120 powtórzeń o coraz mniejszej głośności. O ile mikrofon zarejestruje je wszystkie - patrz wykres - jak również odbiorą go uszy, to jednak tych wszystkich powtórzeń dźwięku już nie usłyszymy. Pogłos jest słyszalny w większych pomieszczeniach niż to z naszego przykładu.

W odniesieniu do próby obliczenia powierzchni, którą ma źródło dźwięku odbitego okazuje się, że dla naszych założeń wyniesie ona 120x 94= 11280 metrów kwadratowych. 1,1 ha. 0,3 m.kw/11280 m.kw=0.00002659574 tj. 0.002659574%

Jeśli uświadomimy sobie jak się przedstawiają proporcje pomiędzy dźwiękiem bezpośrednim i odbitym, pomiędzy powierzchnią membrany głośnika i łączną powierzchnią odbijającą oraz po uwzględnieniu skutków odbić czyli filtracji grzebieniowej możemy obiektywnie zarysować obszar w którym porusza się słuch. Informacja, która nas naprawdę interesuje jest dźwiękiem bezpośrednim, który stanowi znikomy ułamek całości dźwięku będącego poszczególnym zdarzeniem akustycznym. Słyszenie polega zatem nie na odbiorze informacji lecz na jej rekonstrukcji.

wtorek, 9 lutego 2016

Filtracja grzebieniowa zmienia barwę dźwięku

Filtr grzebieniowy w bardzo ciekawy sposób zmienia barwę dźwięku. Można usłyszeć barwę filtra grzebieniowego. Osób niechętne wszelkim testom i eksperymentom mogą obejrzeć film.





Wszystkie tłumienia i podbicia mają częstotliwość zwiększającą się o stałą wartość. W tym przypadku jest to 1000 Hz i ta częstotliwość bierze się z opóźnienia fali odbitej nakładającej się na bezpośrednią.

Filtracja grzebieniowa wynika z tego, że droga fali bezpośredniej jest  krótsza niż odbitej. Częstotliwość barwy filtra grzebieniowego zależy od wielkości opóźnienia biorącego się z tego nadłożenia drogi. W przypadku, gdy linia czerwona będzie dłuższa o 34 centymetry opóźnienie wyniesie 1 milisekundę i barwa filtracji przypadnie na 1000 Hz.

Jeżeli opóźnienie wyniesie 1/1000 sekundy, i pierwszy null przypadnie na częstotliwość f Hz okazuje się, że następna wycięta częstotliwość będzie mieć częstotliwość f+1000Hz, kolejny null przypadnie na f+2000Hz, potem f+3000Hz itd. Każdy kolejny null będzie mieć częstotliwość wyższą o 1 kHz czyli w tym przypadku możemy powiedzieć, że filtr grzebieniowy wytnie nam partie widma co 1000 Hz. To samo dotyczy podbić, każde z nich ma częstotliwość wyższą o 1 kHz.

Gdy opóźnienie w stosunku do fali bezpośredniej ma wartość 1/2000 sekundy, to nulle (tłumienia) i piki (wzmocnienia) wypadną co 2000 Hz. Gdy opóźnienie będzie 1/100 sekundy będą one co 100 Hz. Gęstość wycinania określa się według wzoru 1/t Hz gdzie t jest czasem opóźnienia.  I właśnie taką częstotliwość będziemy słyszeć, jeśli byłaby tylko jedna płaszczyzna powodująca powstanie filtracji grzebieniowej. Przykładowo na środku dużego placu na pewnej wysokości ustawiamy głośnik natomiast słuchacz będzie się do niego przybliżał i oddalał. Jeśli głośnik emitowałby szum różowy, to przybliżając się/oddalać słyszelibyśmy zmianę barwy tego szumu.

Każde odbicie zmienia barwę dźwięku. Im więcej płaszczyzn wywołujących filtrację grzebieniową, tym więcej razy będzie modulowany dźwięk bezpośredni. W pomieszczeniu najsilniejszych podbarwień będzie 6. Podłoga, sufit oraz cztery ściany. Głośników jest 2 więc tych podbarwień będzie 12.

W tym tekście bierzemy pod uwagę wyłącznie pierwsze odbicia. Jednak każde kolejne odbicie, a tych może być kilkaset, również spowoduje powstanie filtra grzebieniowego, tym razem słabszego i o innej częstotliwości podbarwienia, ponieważ kolejne odbicia pokonują coraz większą drogę i są coraz bardziej opóźnione, ale przede wszystkim tracą energię. Poza tym jeśli wykonamy pomiary i obliczymy wielkość opóźnienia dla wszystkich pierwszych odbić, będziemy w stanie określić jakie częstotliwości będą modulowały odbiór dźwięku.

Im mniejsze opóźnienie czyli niższa częstotliwość filtra, tym jest on bardziej odczuwalny. Dlatego zaleca się odsuniecie głośników od ścian, gdyż wynika z tego wyższa częstotliwość podbarwienia dźwięku, która jest mniej dokuczliwa.

Zmiana w barwie muzyki wywołana przez filtr grzebieniowy jest trudniejsza do wychwycenia niż w przypadku użycia szumu. Czy wpływ filtracji grzebieniowej będzie możliwy do wychwycenia zależy od szerokości pasma krytycznego i częstotliwości filtra.