wtorek, 27 grudnia 2016

Na marginesie: Który gramofon lepszy, jak to sprawdzić przed zakupem

Zanim się kupi jakiś sprzęt, każdy chce żeby był tym najlepszym. Po zakupie dzieje się coś dziwnego. Każdy staje się tym jedynym i najlepszym, który ma jakieś nadzwyczajne właściwości. Po prostu wszyscy dorabiają sobie jakąś legendę. Wystarczy zajrzeć na jakieś forum i okazuje się, że każdy sprzęt jest w jakiś sposób unikalny i niezwykły. Mierzalne parametry przestają się liczyć.

Ale przed zakupem to co na papierze się liczy. Niektórzy nawet analizują wykresy. W przypadku gramofonów jest tych wykresów trochę i każdy powoduje zamęt. Z tych wykresów nic nie wynika. Lepiej patrzyć na suche liczby. Chociaż z liczb też niewiele wynika. Czy ktoś zna normy, którymi się posługują laboratoria robiące pomiary? Prawdopodobnie wiedzą co robią tylko ci, którzy mierzą. Dlatego jeśli już porównywać liczby, to tylko z tego samego magazynu, ale także z okresu obejmującego jedną metodologię. Kiedy metoda się zmienia nowych wyników ze starymi porównać już się nie da.

Najciekawszy wykres w przypadku gramofonu to ten.




Do pewnego momentu można się było jakoś w tym rozeznać, teraz już nikt nie wie, co jest na nowych wykresach. Osoby będące czytelnikami magazynu, z którego pochodzi grafika wiedzą o czym mowa. Reszta może sobie darować lekturę tego posta.

Ze swej strony mogę się domyślać, że teraz gazeta stosuje jakieś filtry, które bardziej odpowiadają wrażeniu słuchowemu. W starej metodzie było to, co przyrząd zmierzył, bez filtrowania.

W każdym razie im lepszy gramofon, tym linia niebieska powinna być bliżej czarnej, najlepiej powinna dosłownie leżeć jak naleśnik na patelni na czarnej. Patrząc z innej strony linia niebieska powinna być wyraźnie poniżej czerwonej. Jeśli linia niebieska jest blisko czerwonej lub też nawet się ponad nią wybija, gramofon jest marny.

Nie powinno być też żadnych "pików". Oznaczają one rezonanse lub zakłócenia od sieci/silnika. Dotyczy linii niebieskiej.

Po przeanalizowaniu większej ilości wykresów widać, który gramofon jest lepszy. Ideałem byłby taki, że linia niebieska leży na czarnej aż do okolic 25 Hz. To oznacza, że gramofon nie rezonuje, nie zakłóca i nie ogranicza w żaden sposób dynamiki płyty.

Gramofon z przykładu prezentuje się dobrze. Szpic na linii niebieskiej przy 40 Hz oznacza jakieś zakłócenia od silnika, ale ich poziom jest bardzo niski i nie przeszkadza. Ale są też urządzenia znacznie lepsze.

Trzeba jednak zaznaczyć, że jak gra gramofon nie zależy aż tak bardzo od parametrów. Dzieje się tak dlatego, że każdy gramofon jest w różnym stopniu odporny na wibracje. Można go postawić na czymś solidnym, ale przecież wibruje także powietrze. Więc najlepszy gramofon będzie tym, który jest najbardziej odporny na falę dźwiękową, najmniej rezonuje i mikrofonuje. To właśnie decyduje, że gra dobrze lub nie.

Ale tego nikt nie mierzy. Więc wertowanie danych z pomiarów nie ma sensu, bo są one bezużyteczne. Jednak jak już wspomniałem po zakupie parametry przestają się liczyć. Liczy się legenda. A ta powoduje, że dźwięk też przestaje mieć znaczenie. Znaczenie ma nośnik, ale znaczenie nietechniczne.

niedziela, 18 grudnia 2016

Był sobie transjent

Transient jest słowem, które wywołuje wśród osób zainteresowanych dźwiękiem spore emocje. Co to jest transient wie raczej niewielu, znacząca większość przypisuje mu jednak wręcz magiczną moc. Od transientu ma zależeć wszystko, a nawet więcej, a jeśli chodzi o odtwarzanie i sprzęt, to już ponoć opisać słowami nie sposób.

Okazuje się jednak, że transient ma znaczenie takie samo jak reszta parametrów dźwięku, o ile nie mniejsze niż pozostałe. Wystarczy bowiem usunąć transienty z nagrania i okazuje się, że nadal brzmi dość zwyczajnie. Wszystko zależy od tego jak się je usunie. Wykasowanie całego transientu spowoduje dziwne "zaczynanie się" dźwięków, gwałtowne i nagłe, ale mimo wszystko dźwięki są nadal takie same pod każdym innym względem.

Jeśli ktoś ma chęć, może spróbować sam. Można kasować dużo lub mało, można też zastępować jeden transient innym. Najłatwiej jest zastąpić transient podobnie ukształtowanym szumem. Zabawa z transientami pozwala je oswoić i przekonać się, że nic w nich nie ma magicznego.

Głośniki stojące blisko ścian, które nie są wytłumione, albo stojące na podłodze, która mocno odbija dźwięk powodują, że te odbicia nałożą się na nieustaloną fazę dźwięku i zniekształcą transienty. Zresztą nawet jeśli fala odbita od podłogi kiedy monitor stoi na typowej wysokości opóźnienie jest rzędu dwie, trzy ms. Wobec tego czas jest wystarczająco krótki, żeby "wypaść" na niektórych transientach.

Dźwięk odbity może wzmocnić lub osłabić falę bezpośrednią, dlatego zawsze temu zjawisku będzie towarzyszyć zmiana obwiedni. I jak zawsze nikt tego nie jest w stanie usłyszeć.

Transient jest fazą nieustaloną i dlatego chaotyczną. Zmiana jego natury nic nie zmiana, bo nie może. Transient ma za zadanie przygotowanie do wywołania rezonansu w narządzie słuchu i "zaalertowanie" go do odbioru części zasadniczej, która niesie faktyczną treść.

czwartek, 8 grudnia 2016

Hi-fi czyli skrót, który nigdy nie powinien powstać

Hi-fi oznacza, że sprzęt musi spełnić pewne wymagania, mieć odpowiednio dobre parametry. Przykładowo wzmacniacz nie może szumieć, wnosić zniekształceń, musi zachowywać się liniowo itd. w pewnych granicach, które wyznaczają normy.

Gdyby buty miały normy Hi-fi, jakkolwiek absurdalne to się wydaje, musiałyby mieć odpowiednie wymiary, wymaganą miękkość, musiałyby wytrzymać zadany czas jeśli się je postawi do kałuży – zanim przesiąkną wodą itd.

Spełnianie norm oznacza zachowanie parametrów technicznych. Nawet kawa musi spełniać normy. Pomieszanie pojęć zaczyna się wtedy, kiedy normy zaczyna się interpretować w taki sposób, że dobra kawa poprawia samopoczucie, a buty podnoszą poczucie pewności siebie.

Błąd polega na tym, że nie ma norm na samopoczucie, w odniesieniu do kawy, ani norm pewności siebie w obuwnictwie. Ale takie właśnie podejście zaczęto stosować w Hi-fi.

Niektórzy zaczęli oceniać sprzęt jako taki, który pozwala na odczucia słuchania muzyki jakby się jej słuchało „na żywo”. Lepszy sprzęt – większe odczucie słuchania na żywo, gorszy – mniejsze.

Bezsensowność takiego podejścia wynika z wielu aspektów. Przede wszystkim nawet dwóch słuchaczy będących faktycznie w miejscu, gdzie ktoś coś gra słyszy co innego. Poza tym odtworzenie dźwięku w zamkniętym pomieszczeniu powoduje, że tożsamość nagrania i odtworzenia przestaje istnieć.

Do zmierzenia parametrów głośnika potrzebne jest pomieszczenie bezechowe. W przeciwnym wypadku pomiary byłyby bezwartościowe. Głośnik mierzony w zwyczajnym pomieszczeniu mógłby wykazać zerowe zniekształcenia dla drugiej harmonicznej jeśli mikrofon będzie tak ustawiony, że karb filtra grzebieniowego wypadnie właśnie na nią, a okoliczności akustyczne spowodują, że dźwięk odbity od innych powierzchni akurat do mikrofonu nie dotrze.

Problem z terminem Hi-fi polega na tym, że chociaż w ścisłym sensie dotyczy techniki, to jego nazwa jest na tyle elastyczna, że zamiast technicznych, podkłada się pod niego terminy psychologiczne czy nawet parapsychiczne. Sprzęt ma rzekomo budować jakąś scenę w jakiś metafizyczny sposób, chociaż nie wiadomo co jest budulcem. Bo przecież nie dźwięk z głośnika, który jest tylko 1/10 jednego procenta dźwięku w pomieszczeniu. Warto zdawać sobie sprawę również z tego, że w wielu pomieszczeniach dystans krytyczny wynosi mniej niż metr.

Zamiast techniką, Hi-fi obładowuje się marketingowymi dziwolągami, które może efektownie się prezentują, ale nic nie znaczą. Gdyby zamiast jakiejś „wierności” z nie wiadomo czym mówiono o konkretnych pomiarach, wszystko byłoby jasne.

Wystarczyłoby użyć sformułowania „niskie zniekształcenia” albo „wysoka liniowość” i sprawa byłaby jasna i prosta. A tak w chwili obecnej mamy wysoką wierność. Wierność z czym? I wierność czego? Nie zastosowano żadnego z tych pojęć z tego powodu, że bardzo proste jest sprawdzenie jaki poziom zniekształceń jest słyszalny i do jakiego poziomu poprawianie parametrów ma sens. W ten sposób zarżniętoby kurę znoszącą złote jaja już pod koniec lat siedemdziesiątych. A tak poszukiwacze "wierności" są obrabiani z kasy już prawie pół wieku.

wtorek, 29 listopada 2016

Na marginesie: Kontrola modów przez subwoofer czyli jak w prosty sposób zostać iluzjonistą

Szukając informacji o modach pomieszczenia łatwo natknąć się na takie, które mówią o „kontroli” modów w ten sposób, że dodaje się subwoofer. Kontrola modów przez subwoofer jest dokładnie tym samym, co kontrola nurtu rzeki przez to, że ktoś sobie po niej płynie na dętce. Warto się nad tym przez chwilę zastanowić przypominając sobie takie zjawiska jak fala powodziowa oraz np. fakt, że czasem na rzece są mniejsze lub większe wodospady...

Problem modów polega na tym, że dźwięk jest jakby uwięziony w zamkniętej przestrzeni. Co jednak jeśli źródło dźwięku znajdzie się w polu swobodnym?

Jeśli umieścimy dwa źródła dźwięku w polu swobodnym wcale nie oznacza to poprawy odbioru. Jeśli źródło A będzie pełnopasmową kolumną głośnikową, a źródło S subwooferem, okaże się, że wynikają z tej interakcji same problemy. Dotyczą one tylko zakresu przejściowego, w którym oba źródła pracują równolegle, niemniej jednak problem pozostaje problemem.

Dwa źródła dźwięku powodują, że w pewnej odległości dźwięk będzie się sumował, natomiast w innej znosił. W pierwszym przypadku mikrofon zarejestruje podbicie w zakresie przejściowym, w drugim wystąpi osłabienie. Żaden z tych przypadków nie jest korzystny, gdyż nie uzyskuje się charakterystyki liniowej.

Jeśli więc ktoś zdecyduje się na dodanie subwoofera musi bardzo starannie dopasowywać poziomy i pilnować fazy. Jednak jeśli doda się drugi subwoofer, to ilość problemów się podwoi, bo trzeba będzie pilnować nie tylko poziomu i fazy względem kolumn, ale dodatkowo poziomu i fazy względem drugiego subwoofera. Interakcja obejmuje więcej elementów i staje się jeszcze bardziej złożona. Dodanie trzeciego i czwartego subwoofera tylko tą tendencję pogłębi przy czym należy to rozumieć przede wszystkim jako problem polegający na tym, że w danym miejscu odsłuchu wszystko będzie pasować dla trzech elementów, w innym miejscu będzie pasować też dla trzech elementów, ale nie tych co poprzednio, a w jeszcze innym nic do siebie nie będzie pasować.

Przy czym te rozważania dotyczą pola swobodnego. Dodajmy więc ściany, podłogę i sufit.

Właściwości akustyczne w zakresie niskich częstotliwości najlepiej opisują rezonanse. Ale rezonanse powstają dlatego, że fala odbija się od powierzchni ścian, od sufitu i podłogi itd. Wystarczy tylko jedna płaszczyzna, żeby powstał filtr grzebieniowy. Wystarczy także jedna płaszczyzna, żeby powstała interferencja 1/4 długości fali.

Jeśli nie udaje się dopasować subwoofera do kolumn chociaż teoretycznie powinno się to udać warto przypomnieć sobie o filtrze grzebieniowym i tłumieniu 1/4 fali. Tłumienie 1/4 fali wystąpi nawet wtedy, gdy subwoofer stoi w rogu, trzeba się odwrócić i spojrzeć do tyłu – od tej ściany trzeba liczyć odległość; od ściany do miejsca odsłuchu.

Jeśli do odsłuchu służą zwyczajne głośniki można wytłumić odpowiednie miejsca i zlikwidować tłumienie 1/4 fali i filtr grzebieniowy. Mając jednak dwie kolumny i dwa subwoofery adaptacja akustyczna staje się bardzo trudna.

Wobec tego widać, że dodanie subwoofera spowoduje tylko dodatkowe problemy. Zamiast ujednolicenia otrzymuje się coraz więcej wzajemnych relacji, których nie sposób opanować.

Najważniejsze jest jednak, że bez względu na ilość źródeł dźwięku mody są jakie są, bo wynikają z właściwości pomieszczenia. Iluzja polega na tym, że można sobie powiedzieć, że skoro jest więcej sprzętu i wszystko wygląda jeszcze piękniej, to dźwięk jest lepszy. W ten sposób staje się iluzjonistą, chociaż to żadna sztuka oszukać siebie samego.

wtorek, 22 listopada 2016

Właściwości akustyczne pomieszczeń w zakresie niskich częstotliwości czyli mody

Właściwości akustyczne pomieszczenia można opisać stosując inne podejście w zależności od zakresu częstotliwości. Dla niskich częstotliwości najodpowiedniejsze jest analizowanie rezonansów. W zakresie wysokich częstotliwości odpowiednia jest akustyka geometryczna. Natomiast zakres pośredni najlepiej ujmuje rozpraszanie i dyfrakcja.

Najniższy rezonans wyznacza największy wymiar pomieszczenia. Częstotliwość rezonansu odpowiada fali, która ma dwukrotnie większą długość niż największy wymiar osiowy. Znaczy to, że poniżej pewnej częstotliwości nie wystąpią już rezonanse, ale nie znaczy, że niskich częstotliwości nie da się w małym pomieszczeniu odtworzyć. Falę akustyczną o częstotliwości infradźwiękowej można wytworzyć nawet w tak małej przestrzeni jaką jest opona samochodu. Wystarczy dopompowywać/upuszczać powietrze w odpowiednim rytmie. I na takiej pneumatycznej zasadzie odbywa się propagacja bardzo niskiego basu w malutkim pokoju.

Po wykonaniu, najlepiej przez skrypt, obliczeń okazuje się, że w pokoju mamy np. 150 modów w zakresie od 30 do 300 Hz. Oznacza to, że taką ilość częstotliwości usłyszymy głośniej niż to by wynikało z głośności sygnału. Dla częstotliwości rezonansowych wystąpi również przedłużony czas narastania i wygaszania dźwięku. Czyli pochód szybkich nut granych na basie w pomieszczeniu z silnymi modami, tzn. mało wytłumionymi, będzie mało czytelny. Poszczególne nuty będą na siebie nachodzić i się ze sobą zlewać, a ogólne wrażenie może być też takie, że sekcja się spóźnia w stosunku do reszty instrumentów.

W zależności od położenia słuchacza w pomieszczeniu każdy z przykładowych 150 rezonansów będzie słyszany z inną głośnością. Jeśli słuchacz znajdzie się tam, gdzie jest strzałka, usłyszy dźwięk wzmocniony. Odwrotnie, w węźle dźwięk będzie stłumiony, ale nie znaczy to, że nie będzie słyszalny w ogóle, co na pozór może się wydawać. Dźwięk odbija się od ścian, sufitu i podłogi i dotrze do miejsca o teoretycznie zerowym ciśnieniu inną drogą.



Grafika ilustruje, że słuchacz znajduje się jednocześnie praktycznie i w strzałce i w węźle dla różnych częstotliwości.

Wobec powyższego przemieszczając się w pomieszczeniu słyszymy za każdym razem inną barwę dźwięku. W praktyce różnice w poziomie można bez trudu zauważyć słuchając tonów testowych, ale w przypadku muzyki jest to trudniejsze. Niemniej jednak wykonując pomiary w różnych lokalizacjach otrzymuje się za każdym razem inne wyniki.

Warto zaznaczyć, że dość duże znaczenie ma tłumienie po odbiciu dźwięku od tylnej ściany. Chociaż do opisu zjawisk akustycznych dla niskich częstotliwości najlepiej posługiwać się rezonansami, ale dla odległości 1/4 fali od tylnej ściany tłumienie wynika z odbicia dźwięku.

Adaptacja akustyczna pomieszczenia w zakresie niskich częstotliwości jest związana z dużym nakładem środków i jest trudna. Często większe znaczenie mają wymiary pomieszczenia niż nawet zaawansowana adaptacja.

Pomieszczenie może być akustycznie korzystne lub niekorzystne. Niekorzystne właściwości akustyczne ma każde małe pomieszczenie. Również pomieszczenia o kształcie kwadratu lub zbliżonym do kwadratu źle wpływają na dźwięk w zakresie niskich częstotliwości. Natomiast najgorsze pomieszczenie jest sześcienne i małe.

Pomieszczenie małe jest niekorzystne dlatego, że rezonanse są od siebie oddalone o większą częstotliwość niż w dużych pomieszczeniach. Jeśli przyjmiemy, że każdy mod/rezonans odpowiada potencjometrowi w korektorze graficznym, tzn. korektor będzie miał 100 lub nawet 200 regulacji, to wzmocnienie w każdym z kanałów będzie odpowiadać wzmocnieniu dźwięku przez mod.

Jeśli pomieszczenie jest małe i najniższy mod wyniesie 60 Hz to kolejny będzie mieć dwukrotność tej częstotliwości, a następny trzykrotność. Wobec tego mody będą rozłożone co 60 Hz. To jeśli chodzi o długość pomieszczenia. Dla szerokości najniższy mod może wynieść 70 Hz, więc będą one rozłożone co 70 Hz. Wysokość pomieszczenia także może dać dość wysoką częstotliwość rezonansu np. 80 Hz. Taka sytuacja będzie jeśli pomieszczenie ma wymiary 3x2,5x2,2 metry.

W praktyce odstępy pomiędzy modami mają takie znaczenie, że jeśli porówna się mod do jednego zakresu korektora graficznego, przy czym zakres wzmocnienia dla rezonansu jest wąski w porównaniu do korektora, to trudniej jest wykryć zakolorowanie jeśli częstotliwości wzmacniane są blisko siebie i jest ich dużo. Natomiast jeśli wzmocnienia wypadają rzadko, wtedy jest sytuacja odwrotna. Lepiej jest jeśli wzmocnienia wypadną co 30 Hz niż co 60. Przy dużej ilości modów położonych blisko siebie raczej będzie odczuwane zwiększenie ogólne głośności, przy rezonansach oddalonych od siebie poszczególne wzmocnienia mogą być odebrane jako zakolorowanie.

Sytuacja pogarsza się jeśli weźmie się wszystkie mody osiowe. Jeżeli wymiary pomieszczenia są skorelowane ze sobą, np. długość jest podobna do szerokości, wtedy mody również będą miały podobne częstotliwości i będą położone blisko siebie. W takim przypadku raczej można mówić o znacznie mniejszej ilości wzmocnień, dlatego że te bliskie będą działać jak jedno.

Pomieszczenie o niekorzystnych proporcjach i małe można porównać do użycia korektora graficznego o pięciu pasmach. Wzmocnienie pięciu wąskich zakresów da silne zakolorowanie. Natomiast duże pomieszczenie o korzystnych proporcjach wymiarów z wieloma rezonansami, które są blisko siebie można porównać do korektora z trzydziestoma zakresami. W takim przypadku raczej będzie się odczuwać zwiększoną głośność całego zakresu, niż jego zakolorowanie.

Dla pomieszczenia odsłuchowego, które ma mieć dobre właściwości przyjmuje się kubaturę co najmniej 70 metrów sześciennych i proporcje jak najmniej ze sobą skorelowane, przykładowo 1:1,14:1,39.

Warto wyszukać w sieci jakiś kalkulator modów i sprawdzić jaka sytuacja jest w naszym domu. Przy czym wyniki obliczeń nie mają aż tak dużego znaczenia, bo nie są dokładne. Pomieszczenia mają swe specyficzne właściwości, których skrypty nie uwzględniają. Ogólna tendencja zawsze jednak będzie zachowana.

Wobec tego okazuje się, że odtwarzanie basów jest czymś zupełnie innym niż się powszechnie uważa. Ściśle rzecz biorąc każdy rezonans jest zakolorowaniem dźwięku, jednak mała rozdzielczość słuchu powoduje, że większości z nich nie jesteśmy świadomi. Fakt, że w gruncie rzeczy słyszymy słabo pozwala słuchać muzyki nawet w złych akustycznie pomieszczeniach.

Czytając w jakimś magazynie lub w internecie wynurzenia jakiejś osoby, które dotyczą odtwarzania basu trzeba zadać sobie następujące pytania: jaka jest kubatura pomieszczenia, w którym miał miejsce odsłuch, jakie są wymiary/proporcje tego pomieszczenia, a ponadto jak był ustawiony sprzęt i czy pomieszczenie było adaptowane akustycznie.

Wpływ małego pomieszczenia na dźwięk można porównać do naczynia do którego zostanie wlana ciecz. Ciecz zawsze przyjmuje kształt naczynia. Dokładnie to samo dzieje się z dźwiękiem w małym pomieszczeniu, które ma często niekorzystne proporcje wymiarów i nie ma żadnych adaptacji akustyki. W zakresie niskich częstotliwości słuchamy tak naprawdę naszych mieszkań, brzmienie w niewielkim stopniu odpowiada temu, co jest nagrane. Na szczęście, jak już wspomniałem, słyszymy naprawdę kiepsko i nie potrafimy zdać sobie sprawy z faktycznej jakości dźwięku czy może braku jakości.

poniedziałek, 14 listopada 2016

Winyl może zagrać lepiej, ale tylko w wyobraźni

Ostatnio przypatrywałem się dość zażartej dyskusji pomiędzy fanatykami płyt winylowych i osobami, które tego entuzjazmu nie podzielają. Wychodziło nawet na to, że drogi sprzęt potrafi rzekomo złagodzić skazy na płycie. Może i może, ale tylko wtedy, gdy jest zaczarowany.

W każdym razie żeby tak zażarcie bronić stanowiska, które jest przegrane, trzeba być do niego przekonanym. Więc płyta winylowa musiała kiedyś takiej osobie zagrać ładniej niż jakiś format cyfrowy. Być może stale ładniej gra. Wszystko jest możliwe.

Jeśli chodzi o mnie, to słyszałem na własne uszy brzmienie z płyt winylowych, które mi się bardzo podobało i kto wie czy nie było to najlepsze wrażenie jakie miałem kiedykolwiek podczas słuchania muzyki. A płyty były odtwarzane przez Polskie Radio, na żywo i prosto z winyla, ale jednak przez radio. Sprzęt był dość zwyczajny, ale nie był ustawiony "na zero" czyli z wyłączoną regulacją barwy dźwięku.

Wobec tego trochę zniekształceń radiowych, delikatna regulacja barwy dźwięku i może też trochę zniekształceń sprzętu dało bardzo korzystne brzmienie. Może warto dodać, że były to czasy przed-orbanami.

Z kolei drogie zestawy do odtwarzania płyt winylowych też mają często w zwyczaju dodać trochę zniekształceń, zwłaszcza jeśli w torze są lampy. Ale nawet sprzęt tranzystorowy potrafi trochę zafarbować dźwięk dlatego, że przedwzmacniacze phono, te bardzo drogie, nie mają płaskiej charakterystyki, ale taką "wanienkę". czyli podbity bas i sopran.

Takie podbicie góry i dołu pasma może skutkować tym, że muzyka zagra "piękniej". Zagra piękniej, chociaż nie lepiej i z pewnością mniej wiernie. Ale przyjemnie. Przyjemniej, z pozoru, niż format cyfrowy.

Zresztą sprawdź czytelniku sam. Tanie przedwzmacniacze gramofonowe mają zazwyczaj charakterystykę płaską. Natomiast te drogie nie zawsze.

I na tym polega ten mały szczegół, który robi dużą różnicę. Dodaj trochę zniekształceń, a słuchacz będzie zachwycony.

sobota, 12 listopada 2016

Gra pozorów

Zjawisko audiofilizmu można bardzo trafnie scharakteryzować jako "gra pozorów". Coś "gra" - ma konotacje jednoznacznie dźwiękowe, natomiast pozory trafiają w samo sedno zjawiska.

Jak już to zostało opisane, wrażenia słuchowe nie mają praktycznie nic wspólnego z tym, co się od strony akustycznej dzieje. Słuch ma wręcz nieprawdopodobne możliwości jeśli chodzi o eliminowanie zakłóceń. Dzięki temu dźwięk obiektywnie składający się z samych zniekształceń jesteśmy w stanie usłyszeć jako pozbawiony zakłóceń.

Przykład słynny: żona w kuchni. Oczywiście żona w kuchni potrafiąca stwierdzić, że pewien audiofil wymienił jakiś kabel już dawno stała się przedmiotem drwin, niemniej jednak nie słysząc dźwięku bezpośredniego, ale mając do dyspozycji wyłącznie odbicia, będzie w stanie usłyszeć wszystkie instrumenty i wszystkie szczegóły nagrania... o ile nie będzie używała miksera lub innego hałaśliwego urządzenia kuchennego.

Z kolei małżonek siedzący na wprost głośników także słyszy głównie odbicia, co mu zresztą tym bardziej w niczym nie przeszkadza. Jednak wiadomo, że słyszy coś, co można opisać w taki sposób, że do jego uszu dociera kilkaset wersji tego samego dźwięku, przy czym każdy jest opóźniony o ułamek sekundy w stosunku do poprzedniego. Po dźwięku bezpośrednim dotrze do niego opóźnione o milisekundę odbicie od podłogi, z kolei opóźnione o kolejną milisekundę odbicie od sufitu... W sumie tych powtórzeń będzie kilkaset, a audiofil nawet nie ma pojęcia, że w ogóle są jakieś odbicia. Zapytany walczyłby jak lew broniąc swej racji, że przecież żadnych odbić nie ma, bo gdyby były, to by je słyszał. A przecież on nie słyszy.

A jednak odbicia są. I każde, skoro różni się w fazie, spowoduje deformację dźwięku bezpośredniego. Deformację tak dużą, że od strony pomiarowej dźwięk w pomieszczeniu ma z oryginałem raczej niewiele wspólnego.

Przecież jednak najpiękniejsze w tym wszystkim jest to, że nasz słuch jest konstrukcją tak genialną i zdumiewającą, że potrafi nas oszukać i zwieść całkowicie i w sposób zupełnie niezauważalny. I całe szczęście, że tak działa, bo musielibyśmy polegać tylko na wzroku i może jeszcze dotyku i ewentualnie węchu. A przecież wiemy, że słuch jest bardzo przydatny.

I tak to jest. Gra muzyka, dźwięk jest zniekształcony, ale pozornie krystalicznie czysty.

Aby zilustrować zagadnienie przyjrzyjmy się poniższym grafikom.



Pierwsza grafika przedstawia widmo sygnału źródłowego. W tym przykładzie dźwięk bezpośredni jest szumem różowym. Gdyby próbka była dłuższa, widmo byłoby idealnie równe. Druga grafika przedstawia zjawisko opisane w tekście. Takie spektrum usłyszy odbiorca, jeśli dotrą do niego: dźwięk bezpośredni i trzy odbicia każde opóźnione w stosunku do siebie o około milisekundę.

W syntetycznie wytworzonym dźwięku słychać wyraźnie bardzo silne zakolorowanie. W warunkach realnych przy stukrotnie większej ilości odbić, zakolorowanie będzie nieco inne, jednak wciąż bardzo duże.

Natomiast właściwości słuchu są takie, że nie zdajemy sobie z faktu zakolorowania dźwięku w ogóle żadnej sprawy.

Mam nadzieję, że w tym momencie jest już jasne, co miałem na myśli pisząc "gra pozorów".

sobota, 5 listopada 2016

Ile razy trzeba złamać prawa fizyki, żeby winyl zagrał lepiej niż CD

Ile razy trzeba złamać prawa fizyki, żeby winyl zagrał lepiej niż CD? W zależności od tego jak szczegółowo podchodzi się do tematu może się okazać, że nawet kilkanaście razy. Jednak zwolennikom płyt winylowych prawa fizyki nie przeszkadzają. Im nie przeszkadza nawet zniekształcony dźwięk. Oni to wszystko po prostu ignorują.

W reklamach można często przeczytać, że jakieś urządzenie jest dobre, bo ma najkrótszą możliwą ścieżkę sygnału. W innych reklamach czytamy, że akurat ten plik jest najlepszym możliwym, bo jest dokładnie tym plikiem, który powstał w studio nagraniowym, nie był w żaden sposób konwertowany ani modyfikowany.

Z winylami jest na odwrót. Łańcuch urządzeń, które muszą być włączone w ścieżkę sygnałową jest długi, natomiast przekształcanie i konwersja sygnału jest zaletą. I zamiast odtworzyć plik wzięty bezpośrednio ze studia nagraniowego, przepuszcza się go przez tasiemcowo długi ciąg urządzeń, przekształcając sygnał za każdym razem z jednej formy w inną.

Każde kolejne przekształcenie i każde urządzenie dodaje swoją porcję zniekształceń, szumów itp. i to ma sprawiać, że dźwięk z winyla jest "lepszy".

Jest pewien typ zniekształceń zawartych na płycie analogowej o których mało kto wie. Osoby, które mają płyty winylowe w tym momencie powinny zdjąć z półki dowolną płytę długogrającą i przyjrzeć się zapisowi, najlepiej pod lupą.

Jeśli płyta długogrająca, którą oglądasz zawiera muzykę rozrywkową, albo realizowaną na instrumentach elektronicznych, ale chodzi tylko o instrumenty perkusyjne i bas, można zaobserwować bardzo ciekawe zjawisko.

Na płycie widać bardzo regularne układanie się zapisu w charakterystyczne wzory. Schematycznie sytuacja wygląda jak na rysunku:

Rowki na płycie wpasowujące się w siebie można naciąć znacznie gęściej niż takie, które do siebie nie pasują. Jednak przesunięcie w czasie o ułamek sekundy spowoduje, że niepasujące układy kształtu rowków zamienią się w takie, które świetnie się zgadzają..


Charakterystyczne dla płyt długogrających jest, że często można zauważyć zaskakującą zgodność w układaniu się sąsiednich rowków. Jeśli wystąpi silne wychylenie w którąś stronę, to sąsiadujący rowek wpasowuje się w to wychylenie na zasadzie pokazanej w przykładzie A) natomiast rzadko widać sytuację taką jak w B).

Dlaczego tak się dzieje. Płytę można naciąć na 2 sposoby. Można stosować stałe albo zmienne przesunięcia na obrót płyty. Kiedy głowica nacinająca przesuwa się ze stałą prędkością do środka płyty, występuje "marnowanie miejsca" dlatego, że bez względu na amplitudę sygnału skok będzie taki sam. Wobec tego nacinając bardzo ciche fragmenty zużywa się tyle samo miejsca, co i najgłośniejsze.

Jeśli prędkość głowicy będzie zmienna i skok będzie mały dla cichych fragmentów, a większy dla głośniejszych, wtedy na stronie uda się zmieścić więcej muzyki, przykładowo 20 zamiast 10 minut. Ale "oszczędności" miejsca mogą być jeszcze większe.

Jeśli będzie się zmieniać nie tylko szybkość poruszania się głowicy nacinającej czyli ruch po promieniu w kierunku środka, ale również moment, kiedy wystąpią duże wychylenia, gęstość zapisu jeszcze bardziej wzrośnie.

Nacinając "tak jak jest" do sytuacji A) będzie dochodzić tak samo często jak do sytuacji B). Jeśli jednak przyspieszy się, albo opóźni, sygnał sterujący, tzn. dźwięk, a wystarczy zmiana o ułamek sekundy, to do dojdzie do sytuacji A) natomiast B) nie wystąpi. Wystarczy bowiem przesunąć w czasie dolny rowek z przykładu B) i już mamy "oszczędniejszy" czyli bardziej upakowany zapis i sytuację z rysunku A).

I faktycznie do takich przesunięć sygnału w czasie dochodzi w przypadku płyt długogrających nacinanych z użyciem techniki przewidującej kształt i miejsce rowków nawet kilka razy na obrót płyty.

Od strony praktycznej nacinanie z przewidywaniem ścieżki odbywa się w ten sposób, że trzeba śledzić sygnał z wyprzedzeniem dokładnie takim, jaki wynika z prędkości obrotowej płyty. W czasach czysto analogowych odbywało się to w ten sposób, że magnetofon odtwarzający taśmę matkę miał dwie głowice odczytujące i specjalnie ukształtowany tor taśmy, aby druga głowica trafiła dokładnie w to samo miejsce w czasie co głowica nacinająca po tym, kiedy płyta wykona pełen obrót. Takie magnetofony mają dodatkowe rolki, które pozwalają wydłużyć lub skrócić pętlę taśmy w zależności od prędkości nacinanej płyty. Przewidywanie wychylenia i układu rowków może być stosowane także do płyt 45 obrotów/minutę.

Jeśli więc ktoś będzie się upierał, że LP ma lepszy "timing" wtedy wyjaśnijcie mu, że niestety nie dotyczy to większości płyt, gdyż zapis na nich nieustannie zwalnia i przyspiesza. A wszystko po to, żeby nagrać dłuższy utwór na jednej stronie i żeby dźwięk był trochę głośniejszy.

Warto dodać, że ludzie najzapalczywiej dyskutujący o płytach winylowych przeważnie nie mają ich, anie też gramofonów, więc też nie mogą się przekonać doświadczalnie o czym mówią. Dla tych osób mam nagranie z płyty winylowej. To jest fragment piosenki, ale za to jest cały rowek początkowy i końcówka. W tych właśnie fragmentach, kiedy muzyka nie zagłusza zakłóceń zawartych na płycie najlepiej słuchać "lepszą jakość" płyt winylowych. Fragment dźwięku zngranego z winyla. Jeśli ktoś się przymierza na skompletowanie zestawu do odtwarzania płyt winylowych powinien mieć świadomość tego, że bez względu na ilość pieniędzy, którą wyda, te wszystkie brudy i zakłócenia będą mu towarzyszyć zawsze podczas słuchania, ponieważ one na płytach po prostu są. Ale może o to, żeby te zakłócenia słyszeć idzie gra? Może, ale skoro tak, to ja tego nie jestem w stanie zrozumieć.

piątek, 28 października 2016

Zniekształcenia fazowe

Grafika poniżej ilustruje przesunięcie fazy dwu sinusoid.


Do określenia przesunięcia faz używa się miary kątowej. 

Zniekształcenia fazy są w obszarze sprzętu odtwarzającego dźwięk powodem dużego zamieszania. Dotyczy to rzekomej wrażliwości słuchu na takie zniekształcenia. Nawet istnieje firma produkująca sprzęt, który ma charakteryzować minimalne zaburzenia fazy przetwarzanego sygnału.

Niewrażliwość słuchu na przesunięcie czy zniekształcenie fazy można sprawdzić w prosty sposób używając programowego jej przesuwania. Czyli wystarczy włączyć program, który wprowadzi w kontrolowany sposób przesunięcia fazy do sygnału i można stwierdzić, że się tego nie daje usłyszeć.

Nie może być inaczej niż właśnie tak, że słuch jest zupełnie głuchy na przesunięcia fazy sygnału.


Powyższy schemat pokazuje co się stanie, jeśli doda się dwie sinusoidy, które są względem siebie przesunięte w fazie. W przykładzie są dwie składowe o identycznej częstotliwości, z których druga jest przesunięta względem pierwszej. Po zsumowaniu otrzymuje się sinusoidę o większej amplitudzie i innej fazie niż dwie składowe.

Jest to jedna z wielu opcji. W ogólności może dojść do trzech rodzajów zdarzeń. Jeśli sinusoidy są zgodne w fazie będą się dodawały bez przesunięcia fazy lub znosiły do zera, jeśli będą mieć odwrotną polaryzację. Trzeci przypadek gdy składowe są przesunięte zawsze dojdzie do przesunięcia fazy w sygnale sumy.

W praktyce oznacza to, że słuchając muzyki w pomieszczeniu dochodzi do nieustannej zmiany fazy w słyszanym dźwięku. Nie chodzi tu nawet o to, że źródłem dźwięku jest sprzęt audio. Nawet dźwięk mowy lub instrumentu na żywo będzie słyszany z permanentnymi zniekształceniami fazowymi.

W pomieszczeniach mamy do czynienia z odbiciami. Wobec tego jeśli odbicie nakłada się na dźwięk bezpośredni, dochodzi do zmiany fazy sumy. Jak już zostało powiedziane nie dojdzie do przesunięcia tylko wtedy, kiedy składowe są zgodne w fazie, czyli w znikomym odsetku przypadków. W związku z tym jeśli weźmiemy odbicia zawierające się w przedziale czasu określonym przez RT60, czyli tych odbić może być kilkaset, przesunięcie fazy słyszanego dźwięku, np. pojedynczej nuty, będzie mieć miejsce właśnie kilkaset razy w czasie jej trwania.

Można powiedzieć, że do zniekształceń fazy nie dojdzie tylko wtedy, gdy występuje dźwięk bezpośredni, a więc w początkowym ułamku sekundy. Wobec tego dociera do nas niezniekształcony dźwięk bezpośredni. Niestety tak nie jest.

Gdyby muzyka składała się z pojedynczych dźwięków, przy czym każdy następny byłby zagrany dopiero wtedy, gdy wybrzmi poprzedni i na dodatek mógłby grać tylko jeden instrument i tylko pojedynczą nutę, nigdy akord, a wokalista mógłby śpiewać tylko wtedy, gdy nie gra żaden instrument, można by mówić o niezniekształconym dźwięku bezpośrednim. Skoro jednak muzyka to dźwięki grane akordami przez wiele instrumentów równocześnie nigdy nie będzie w praktyce takiej sytuacji, że jakiś dźwięk dotrze do słuchacza w postaci czystej. Zawsze będzie się nakładał na inne dźwięki, które istnieją w otoczeniu. A skoro tak, zawsze dojdzie do przesunięcia fazy.

Przesunięcie fazy zachodzi wtedy, kiedy nakładają się na siebie dwie lub więcej fal o jednakowej częstotliwości. Jeśli częstotliwości są inne zsumowanie sygnału nie spowoduje przesunięcia faz składowych i suma będzie miała fazę niezmienioną. Ponadto w momencie nałożenia się fal o różnych fazach dochodzi do miany częstotliwości, jednak tylko w jednym cyklu, czyli częstotliwość na jeden okres się zwiększy lub zmniejszy.

Skoro do przesunięcia fazy dochodzi nawet kilkaset razy w czasie trwania dźwięku, w sensie poszczególnej nuty, a ponadto za każdym razem zmienia się na jeden cykl częstotliwość, to te zmiany nie mogą być słyszane, bo wprowadziłyby ogromne zmieszanie. Zupełnie jak to, że nie możemy być wrażliwi na fluktuacje amplitudy. A zamiana amplitudy jest najważniejszym aspektem nakładania się na siebie fal o różnej fazie. Zmiana amplitudy jest zjawiskiem najprostszym do zmierzenia. Zmiana częstotliwości i zmiana fazy jest trudniejsza do pomiaru, ale jak najbardziej możliwa.

Zmiany fazy a także częstotliwości i zwłaszcza głośności są możliwe do wykazania w pomiarze, ale raczej tylko dla sygnałów testowych, czyli sinusoid. W sygnale kompleksowym a zwłaszcza muzycznym pomiar będzie trudny albo nawet niemożliwy. Natomiast usłyszenie tych zmian czy nawet sama chęć ich usłyszenia nie ma sensu.

sobota, 22 października 2016

Zniekształcenia obwiedni

Kolejnym typem zniekształceń dźwięku, których nie potrafimy usłyszeć pomimo ich dużej skali są zniekształcenia obwiedni w odniesieniu do narastania i zanikania. 

Zniekształcenie polega na tym, że wystąpią narastanie i zanikanie, których to elementów nie powinno być w ogóle. Wygasanie, które trwa pewien czas wiąże się z czasem potrzebnym do rozproszenia nagromadzonej energii. Ten aspekt, czyli wygasanie sygnału jest dobrze znany i wiąże się z pogłosem. Słabo znane jest natomiast narastanie sygnału.

Zniekształcenie transientu powstaje wtedy, gdy dźwięk ma częstotliwość jednego z rezonansów pomieszczenia. W tym przypadku nie mówi się o zanikaniu sygnału jako o pogłosie, ale raczej o wygasaniu rezonansu, częstotliwości modalnej, pomieszczenia.

W praktyce słuchając muzyki w pomieszczeniu, które nie ma wytłumionych modów każda częstotliwość dźwięku instrumentów pokrywająca się z modami zostanie zniekształcona w ten sposób, że dźwięk będzie narastał przez pewien czas. Czas narastania dźwięku dla częstotliwości rezonansowych pomieszczenia wynosi pewien ułamek sekundy. W wielu przypadkach może on wynieść np. pół sekundy, a nawet więcej.

Z występowania tych zniekształceń zdaje sobie sprawę znikomy odsetek słuchaczy.

niedziela, 16 października 2016

Bezwładność częstotliwościowa słuchu

W tym poście będzie o kolejnym typie zniekształceń, które nie są możliwe do usłyszenia, chociaż mogą być bardzo duże.

Osoby interesujące się akustyką wykonały lub przynajmniej widziały wykresy z pomiarów charakterystyki w pomieszczeniu odsłuchowym. Takie wykresy charakteryzują bardzo duże nierówności. Przykładowo dla częstotliwości 50 Hz będzie zmierzona pewna wartość, natomiast dla częstotliwości minimalnie wyższej już 10 dB więcej, a dla kolejnej jeszcze nieco wyższej częstotliwości nawet 20 dB mniej niż dla 50 Hz.

Akustycy powiedzą, że taki "surowy" pomiar nic nie mówi o tym, jak się odczuwa charakter pomieszczenia na słuch. Dlatego stosuje się uśrednianie. Dopiero charakterystyka uśredniona odpowiada wrażeniu słuchowemu i może być podstawą do adaptacji.

Rozdzielczość częstotliwościowa słuchu jest bardzo mała w porównaniu do rozdzielczości sprzętu pomiarowego. Jest to spowodowane tym, że słuch działa na zasadzie filtrów środkowo-przepustowych. W ślimaku mamy bank filtrów, który pokrywa cały zakres częstotliwości słyszalnych.

Szerokość filtru określa jego pasmo krytyczne.



Rysunki pokazują relację filtra grzebieniowego do pasma krytycznego. W zależności od opóźnienia pomiędzy falą bezpośrednią i odbitą wystąpią różne odstępy pomiędzy grzbietami filtra. Na rysunkach pokazane są trzy warianty opóźnień.

Im grzbiety filtra są gęstsze tym trudniejsze jest wykrycie zakolorowania spowodowanego jego działaniem. W przypadku 1) zakolorowanie będzie słyszalne, bo pasmo krytyczne jest węższe niż odległość pomiędzy grzbietami filtra grzebieniowego. W przypadku 2) kiedy szerokość filtra jest porównywalna z odstępem między grzbietami zakolorowanie może być usłyszane. Natomiast w przypadku 3) gdy grzbiety są bardzo gęste i nieporównywalnie węższe niż szerokość pasma krytycznego, zakolorowanie nie może być usłyszane.

Co to oznacza w praktyce.

Okazuje się, że z widma można wyciąć część pasma i nie będzie to możliwe do usłyszenia. Można wycinać fragmenty pasma, ale również zmieniać EQ w dowolny sposób i nie będzie to możliwe do wykrycia jeśli wytniemy zakresy odpowiednio wąskie, oczywiście w odniesieniu do pasma krytycznego.

Manipulacja jest tym łatwiejsza im wyższe są częstotliwości. Z tej właściwości słuchu korzystają wszystkie kodeki stratne takie jak mp3. Kodek analizuje dźwięk zwłaszcza pod kątem maskowania i jeśli uzna, że jakiś dźwięk będzie maskowany może go śmiało wyciąć, albo przynajmniej "poszatkować". Ale wyciąć pewne części widma można także wtedy, gdy dźwięk nie będzie maskowany. Wszystkie te manipulacje kodeka pozostaną niezauważone, jeśli ingerencja będzie mieć zakres, który nie przekroczy pewnego zakresu szerokości pasma krytycznego.

Wycięcie pewnych pasm przez kodeki stanowi problem polegający na precyzji cięcia. Trzeba wyciąć wąskie pasma, a to w początkowych stadiach rozwoju kodeków stanowiło pewien problem. Dlatego ingerencja była możliwa do usłyszenia. Kodek zniekształcał to, co zostawało. Dziś przy nawet umiarkowanej przepływności nie da się już odróżnić wersji oryginalnej i stratnej.

Jak widać dźwięk można zniekształcić bardzo mocno, bo można w ogóle wyrzucić dość znaczne fragmenty widma i się tego nie zauważy. Tak jak się nie słyszy skutków działania filtra grzebieniowego dla większych opóźnień.

czwartek, 6 października 2016

Bezwładność amplitudowa słuchu

Bardzo rozpowszechniony jest pogląd o czymś co można określić jako "wszystkosłyszenie". Polega to na tym, że wiele osób jest przekonana o doskonałości słuchu i możliwości usłyszenia niezwykle małych i subtelnych niuansów dźwięku. Generalnie myśli się o możliwości usłyszenia nawet najmniejszych zniekształceń wnoszonych przez sprzęt.

Faktycznie słuch jest narządem wyjątkowo odpornym na zniekształcenia i aby jakieś usłyszeć muszą one być spore. Niektóre typy zniekształceń muszą być naprawdę bardzo duże, żeby w ogóle można je było usłyszeć, a nawet są takie, których się w ogóle nie słyszy mimo ich rozmiaru. 

Jeżeli odtworzy się ton sinusoidalny trwający np. sekundę, będą temu towarzyszyć bardzo duże zniekształcenia amplitudy, których nie będziemy w stanie w ogóle usłyszeć. Ten typ zniekształceń dotyczy każdego typu sygnałów, także mowy i muzyki, ale zostanie opisany na przykładzie sygnału sinusoidalnego.


Narastanie dźwięku w pomieszczeniu. Z powodu nakładania się odbić na dźwięk bezpośredni zamiast stałej głośności B natężenie dźwięku wzrasta. Wzrost głośności jest skokowy, linia przerywana obrazuje średnią.

Rysunek pokazuje sytuację, kiedy w pomieszczeniu jest odtwarzany sygnał o stałej głośności, która wynosi B, od pierwszej litery słowa Bezpośredni. W miejscu oznaczonym jako "Ź" znajduje się źródło sygnału. Sygnał jest odbierany przez mikrofon. Dźwięk dociera do mikrofonu początkowo drogą bezpośrednią, a następnie dochodzą odbicia, których faktycznie jest kilkaset, ale zaznaczone zostały tylko cztery.

W dolnej części rysunku jest pokazane co "słyszy" mikrofon. Najpierw przez chwilę mikrofon "słyszy" dźwięk bezpośredni o głośności B. Następnie po dotarciu pierwszego odbicia, odbicia są oznaczone jako O tzn. Odbicie, głośność dźwięku odbieranego przez mikrofon wzrasta od B do głośności B+O1. Po pewnym czasie kiedy do mikrofonu dotrze drugie odbicie O2 głośność wzrośnie do B+O1+O2 tzn. do dźwięku bezpośredniego dołoży się oprócz pierwszego odbicia także drugie. Z kolei ogólna głośność wzrośnie o odbicie trzecie i w końcu czwarte.

Jeśli pomieszczenie ma RT60 wynoszący 1 sekundę oznacza to, że przez cały czas trwania dźwięku jego głośność będzie skokowo wzrastać przez dodawanie się kolejnych odbić. Gdyby dźwięk trwał dłużej, np kilka sekund, to jego głośność stałaby się stała, dopiero po upływie sekundy.

Wobec tego głośność sygnału stale wzrasta, chociaż z praktyki wiadomo, że tego wzrostu się nie słyszy. Wystarczy odtworzyć jakikolwiek ton testowy czy dźwięk o stałej głośności i słyszy się go jako taki, który ma przez cały czas trwania niezmienną głośność.

Słuch nie reaguje na wzrost głośności, która ma tu miejsce i często jest to wzrost znaczny dlatego, że w skrajnym przypadku dla basów jeśli głośnik stoi w narożniku może wynieść np. 10 dB lub więcej.

W praktyce każdy dźwięk, każda nuta, każda głoska słyszana w pomieszczeniu charakteryzuje się narastaniem głośności, której nie słyszymy. Narastaniem lub spadkiem, a w ogólności fluktuacją.

Przykład rysunkowy jest bardzo ogólny. Dlatego, że odbicia nie muszą się nakładać na dźwięk bezpośredni wzmacniając go, ale mogą się z nim znosić. Niektóre odbicia wzmacniają dźwięk bezpośredni inne go osłabiają, więc występuje zjawisko, które można określić jako fluktuacja głośności.

Najważniejsze są najsilniejsze odbicia i to one decydują czy dźwięk będzie wzmocniony czy stłumiony. Jeśli kolumna stoi przy ścianie, to odbicia będą wzmacniać basy poza kilkoma częstotliwościami określonymi przez SBIR. Ogólnie rzecz biorąc część odbić wzmacnia dźwięk bezpośredni, część go osłabia, więc zawsze występuje wahanie amplitudy i zawsze jesteśmy tego nieświadomi.

Dźwięk charakteryzują właściwie tylko 3 cechy: częstotliwość, amplituda i czas trwania. Okazuje się, że 1/3 z tego nie jesteśmy w stanie odebrać właściwie. Powodem tego  jest bezwładność amplitudowa słuchu, która polega na tym, że szybkich zmian amplitudy nie rejestrujemy. Taka właściwość słuchu jest konieczna, żeby w ogóle coś słyszeć. Propagacja dźwięku jest obarczona różnego rodzaju zakłóceniami, które należy jakoś obejść. Jednym ze sposobów jest obniżenie czułości słuchu na szybkie zmiany amplitudy.

niedziela, 25 września 2016

Konferencja prasowa

Ostatnio oglądałem pewną konferencję prasową i nie byłem w stanie zrozumieć słowa z tego co tam ludzie mówią, tak źle był zrealizowany dźwięk. A był zrealizowany tak źle, bo typ z mikrofonem, pracownik telewizji, nie miał pojęcia o tym czym jest dźwięk i jak się posługiwać mikrofonem.

Redaktor siedział na tej konferencji prasowej z mikrofonem, patrzył na to co się wokoło dzieje i wydawało mu się, że skoro wszystko widzi to i mikrofon tak samo "zobaczy". Niestety mikrofon nie ma funkcji zoom jak w kamerze i nie można nim zrobić zbliżenia. Kamerę można obrócić w drugą stronę i pokaże ona coś zupełnie innego, natomiast z mikrofonem można chodzić po całej sali i wszędzie będzie słychać mniej więcej to samo.

Gdy w czterech kątach pomieszczenia postawi się cztery osoby i każda będzie robić co innego, jeśli się nakieruje obiektyw na którąś z nich, pokaże on tylko tę osobę. Ale jeśli cztery osoby będą coś jednocześnie mówić, to możemy kierować mikrofon w stronę każdej z nich, ale zawsze będziemy mieć na nagraniu cztery głosy, a nie tylko jeden.

Dźwięk to zmiany ciśnienia i w każdym miejscu są podobne, bo dźwięk rozchodzi się we wszystkie strony jednakowo, podobnie jak np. zapach. Nie pomoże kierunkowy mikrofon. Ściany podłoga i sufit odbijają dźwięki. Żeby mieć na nagraniu jedną osobę trzeba podejść do niej blisko i wtedy jej głos będzie dużo głośniejszy niż pozostałe, ale nie znaczy to, że będzie słychać tylko jeden głos. Jeśli wszyscy mówią jednocześnie, będzie słychać wszystkie głosy, ale nie każdy tak samo głośno.

Mikrofon nie zoomuje, więc jeśli się jest na konferencji prasowej trzeba podsunąć mikrofon dosłownie pod nos żeby mówiącego było słychać. To, że kogoś dobrze widać nie znaczy, że mikrofon złapie tak samo dobrze głos. Dźwięk się odbija i wraz z odległością odbić jest coraz więcej. W końcu odbić jest tak dużo, że nic nie można zrozumieć.

Problem na konferencji prasowej o której mowa polegał przede wszystkim na tym, że odległość dzieląca mikrofon i osoby wypowiadające się była tak duża, że odbić dźwięku tzn. pogłosu, a wręcz echa, było tyle, że o jakiejkolwiek zrozumiałości słów nie mogło być mowy.

Realizacja dźwięku jest dziedziną bardzo obszerną i wymagającą dużej wiedzy. Ale chyba można wymagać od ludzi biorących pieniądze za realizację dźwięku przynajmniej tyle, żeby wiedziały, że żeby coś nagrać trzeba do tego przysunąć mikrofon?

Skoro rzekomi profesjonaliści zajmujący się realizacją dźwięku nie mają pojęcia o tym co robią, co można powiedzieć o amatorach? Dlatego nie dziwi świat pełen zjawisk paranormalnych w którym poruszają się ludzie pasjonujący się sprzętem audio jeśli nawet tzw. "zawodowcy" nie mają żadnego pojęcia.

wtorek, 6 września 2016

Wątpliwości

Teksty w czasopismach audio i w reklamach od lat eksploatują bardzo powszechną obawę, którą można streścić w słowach "czy wszystko usłyszę?" Mianowicie nagrania mają zawierać, rzekomo, jakieś takie subtelności, których można nie usłyszeć jak się używa zwykłego sprzętu.

Takich subtelności nie ma.

Jeśli jest coś, co słyszysz a wcześniej nie słyszałeś, dzieje się tak dlatego, że wcześniej nie słuchałeś uważnie, albo za cicho lub w hałasie. Każdy sprzęt jest wystarczający do usłyszenia wszystkich subtelności zawartych w nagraniu. Gdyby nie przydźwięk z sieci, to wystarczający byłby nawet Taraban 2.

Relatywnie marny sprzęt wystarczy do tego, żeby usłyszeć wszystko, co jest w nagraniu. Osoby lepiej pamiętające czasy analogowe dobrze wiedzą o co chodzi. Zakłócenia od napędu gramofonu, przydźwięk sieci, szum taśmy itp. są bardzo ciche ale zawsze słyszalne. Jeśli występowały, zawsze je było słychać. A przecież muzyka jest głośniejsza niż zakłócenia. Więc skoro muzyka jest głośniejsza od zakłóceń, więc na pewno będą słyszalne wszystkie szczegóły, skoro zakłócenia, subtelniejsze i cichsze są słyszalne.

Obawy, że nie usłyszy się czegoś w nagraniu powstają wskutek nieodpowiedniego wyobrażenia jak działa sprzęt audio. Wiele osób wyobraża sobie, że działa on jak hulajnoga, która popchnięta dojedzie dalej, jeśli jest lepsza. Dlatego wielu myśli, że sprzęt lepszy odtworzy coś dokładniej i np. jakiś cichy dzwoneczek będzie wybrzmiewał dłużej na lepszym sprzęcie niż na gorszym. Porównanie z hulajnogą nie ma sensu, bo sprzęt grający jest jakby pojazdem z silnikiem i nie jedzie rozpędem. Dlatego pojazd silnikowy dojedzie zawsze tam, gdzie chce kierujący i nawet mówienie, że pod górkę pojedzie lepiej ten, który ma silniejszy motor nie ma sensu. W audio jeździ się zawsze po płaskim.

Wobec tego każdy delikatny dźwięk na słabym i świetnym sprzęcie wybrzmiewa tak samo i co najwyżej na słabym ma trochę większe zakłócenia. Zresztą można spróbować samemu posłuchać nagrań zawierających subtelności na słabym sprzęcie, a nawet z plików mp3. Wszystkie szczegóły będą zawsze słyszalne.

Najśmieszniejsze w tym wszystkim jest to, że ludzie uważają za "subtelności" w nagraniach faktycznie dźwięki głośne. Jest w sieci taki filmik, gdzie ludzie słuchają jakichś nowych głośników. Kamera nagrywa głos przez mikrofon. W pewnym momencie jeden facet mówi do drugiego, że zaraz będzie w tym utworze moment jak coś upadnie na ziemię i to będzie słychać przez głośniki. I to rzeczywiście słychać nawet na tym filmie, kiedy jakaś kamera nagrywa dźwięk przez mikrofon, a serwis z filmami kompresuje dźwięk.

Z drugiej strony w nagraniach są dźwięki, których większość ludzi nie słyszy, bo są subtelne. Na przykład gramofony Audio Technica AT LP 120 są znane ze stukania napędu. Ale osoba, która nagrała ten film nie słyszy tego.





Na filmie dźwięk z płyt jest nagrywany z wyjścia gramofonu i ten stukot napędu jest wyraźnie słyszalny, oczywiście potem jest zagłuszony przez muzykę. Subtelny szczegół jest słyszalny, ale wiele osób nie jest w stanie tego zauważyć.

Subtelności w nagraniach są. Ale nie słyszymy ich nie ze względu na sprzęt.

piątek, 2 września 2016

200 wat dla monitora czyli dopasowanie mocy wzmacniacza do kolumn po raz ostatni

Każda opinia, nawet bezsensowna, ma jakieś swoje źródło. Także obiegowy pogląd, że monitory wymagają silniejszych wzmacniaczy niż kolumny podłogowe.



Zdjęcie pokazuje profil zapotrzebowania na moc wzmacniacza dla kolumny Infinity Alpha 10.

Półkowe kolumny Infinity Alpha 10


Według czasopisma, które tabelkę opublikowało do tych małych kolumn potrzeba wzmacniacza, który ma co najmniej 200W na 4 ohmy. Co najmniej 200, czarno na białym, "ab 200W" jest napisane wyraźnie. Skoro wzmacniacz ma mieć co najmniej 200W, wobec tego dla spokojności trzeba sobie kupić taki, który ma 250W, oczywiście na kanał.

Kilka stron dalej ta sama gazeta testuje monobloki. Nie są to te ogromne monstra, które trzeba nosić we czterech, ale mimo wszystko sprzęt jest dużego kalibru. Testowane są cztery typy urządzeń. Moce urządzeń, oczywiście wszystko dla obciążenia 4 ohm wynoszą: 227W, 176W, 192W oraz 146W. Jak widać, według kryteriów dotyczących testowania kolumn, ciężka artyleria w postaci monofonicznych wzmacniaczy mocy albo ledwo wystarczy, albo - w trzech przypadkach na cztery - ma moc niewystarczającą.

W danych dla tych głośników podaje się jednak, że można je obciążać mocą do 80W. Większość małych głośników w ogóle nie jest w stanie przyjąć dużych mocy. Można znaleźć monitory trochę większe i bardziej wytrzymałe, jednak małe kolumny z małym głośnikiem z małą cewką nie są w stanie sobie poradzić z dużymi mocami. Większość prądu przecież zamienia się w ciepło i malutka cewka z naprawdę cieniutkim drutem nie ma szans z mocami rzędu 200W. Uzwojenie cewki małego głośnika to nie żarówka dwusetka. Drut niby taki sam na grubość, ale jednak w żarówce jest wolframowy i bańka z gazem powoduje, że nie odparuje, choć się mocno nagrzeje. Drut miedziany nie wolfram, a kolumna nie żarówka.

Jeśli ktoś chciałby zagrać głośno na małych monitorach, to może być pewny, że jeszcze będzie trochę brakowało do 100W a już cewka zacznie tłuc w magnes, co niechybnie świadczy o tym, że głośnik wkrótce dokona żywota.

Skąd wzięły się te absurdy?

Gazeta przyjęła, że moc którą podaje jako potrzebną do wysterowania kolumn będzie taką, która pozwoli osiągnąć "głośność oryginału". Nie wiadomo dokładnie jaka jest ta głośność oryginału, ale prawdopodobnie coś w okolicach 96 dB. Problem w tym, że większość monitorów nie jest przystosowana do pracy z takimi poziomami. Są takie, które w ogóle nie są w stanie osiągnąć takich głośności, a większość tych, które potrafią robią to przy dużych zniekształceniach.

Monitory często nie są w stanie sprostać wymaganiom "głośności oryginału", Mają za małą powierzchnię membran, za małe cewki, za małe skrzynki itd. Często uda się dopchać monitory do tej abstrakcyjnej "głośności oryginału" ale zawsze wiąże się to z przesterowaniem, kompresją i przeciążeniem. Dla wielu typów monitorów praca przez dłuższą chwilę z mocą podawaną jako minimalna moc wzmacniacza skończy się ich zniszczeniem.

Przykładowo nawet bardzo dobre monitory, zdecydowanie high-end, uznawane za jedne z najlepszych w swojej klasie, potrafią co najwyżej 91 dB, oczywiście przy niskich zniekształceniach i braku kompresji.

Gazeta, która publikowała te oderwane od realiów dane dotyczące zapotrzebowania na moc już od dawna tego nie robi. No ale co się stało, to się nie odstanie. I nikt nie cofnie już tego nonsensu, że te Alphy 10 potrzebują wzmacniacza 200W. Tych testów jest zresztą więcej i praktycznie za każdym razem można znaleźć kosmiczne zalecenia co do mocy wzmacniaczy w odniesieniu do monitorów.

O absurdalności takich zaleceń najlepiej wiedzą posiadacze małych monitorów. Próba grania z dużymi mocami nie ma sensu, bo już przy dość umiarkowanych takie głośniki mocno zniekształcają. Jeśli ktoś nie wierzy, niech zabierze swoje monitory do kogoś, kto ma wzmacniacz dużej mocy wyposażony we wskaźniki. Kilka minut z mocą podawaną jako minimalna moc wzmacniacza będą ostatnimi w życiu tych głośników.

Skąd brały się te bezsensowne zalecenia mocy minimalnej. Stąd, że przyjęto oderwane od realiów założenie głośności oryginału. Założenie jest od czapy, bo jest bardzo dużo głośników, które temu wymaganiu nie sprosta. Z drugiej strony efektywność monitorów jest przeważnie mniejsza niż kolumn większych - podłogowych. Stąd, o ile głośnik w ogóle jest w stanie tak głośno zagrać, moc potrzebna do osiągnięcia "głośności oryginału" dla monitorów jest większa niż dla dużych zestawów.

Niższa efektywność kolumny nie oznacza, że potrzebuje ona do pracy silniejszego wzmacniacza. W normalnej praktyce słucha się z mocami poniżej jednego wata. Słuchanie z mocą 1 W jest często nieprzyjemne, bo ponad 80dB w domowych warunkach jest już ponad zwyczajną głośność. Natomiast moce rzędu 10 czy 20 W oznaczają, że trzęsie się cały dom, sąsiedzi dzwonią na pały, że zakłóca się porządek i ciszę, a uszy tracą swoje właściwości słyszenia. Znaczy głuchną.

sobota, 27 sierpnia 2016

Burn-in kabli

Wygrzewanie kabli jest jednym z tematów, które budzą kontrowersje. Najciekawsze jest to, że osoby optujące za tym, że wygrzewanie ma wpływ na kabel nie rozumieją czym jest prąd elektryczny.

W potocznym rozumieniu prąd elektryczny polega na tym, że elektrony wędrują wzdłuż przewodnika z prędkością światła lub do niej zbliżoną. I wobec tego po jakimś czasie te elektrony spowodują, że drogi, którymi się one poruszają będą "lepsze" na zasadzie takiej jak wydeptana ścieżka czy noszone przez jakiś czas buty.

Prąd elektryczny jeśli się to odniesie do prądu przemiennego praktycznie nie polega na ruchu elektronów. Elektrony poruszają się i można obliczyć z jaką prędkością, a ta prędkość nazywana jest dryftem.

Średnia prędkość dryftu elektronów w przewodniku wynosi około 10−4 m/s = 0,1 mm/s. W odniesieniu do prądu przemiennego elektrony poruszają się przez pewien czas wynikający z częstotliwości w jedną i następnie w przeciwną stronę. Wobec tego elektrony w sumie nie ruszają się z miejsca, ponieważ poruszają się na odległość ułamka mikrometra ze wspomnianą prędkością 0,1mm/s w jedną stronę przewodnika, a następnie w przeciwną czyli oscylują wokół określonego miejsca.

Wyobrażenie sobie, że elektrony przy częstotliwości 20 kHz przemierzą kabel głośnikowy o długości np. 2 metry 20.000 razy na sekundę w każdą stronę jest błędne. Dystans, który przemierzy elektron w ciągu sekundy nie wyniesie 40 kilometrów, a jedynie około 0,1mm.

Innym aspektem tzw. wygrzewania kabli byłoby, że zmieniają one pod wpływem prądu swe właściwości. W związku z tym przewodnik musiałby wykazać inne właściwości fizykochemiczne gdyby został "wygrzany". Jednak nikt nigdy nie stosował technologii zmiany właściwości metalu przez przepuszczanie przez niego symfonii.

Ale może to jest sposób na zamianę miedzi w złoto?

wtorek, 23 sierpnia 2016

Holografia, dźwięk 3D, przestrzenność

Efektu przestrzenności nie można uzyskać z dwu głośników. Jednak czasem ktoś pisze, że słyszy dźwięki dochodzące z góry, z dołu, z przed głośników i zza nich, a ponadto spoza bazy stereo tzn. na prawo od prawej kolumny i vice versa.

Dźwięk słychać z tego miejsca, gdzie jest jego źródło. Jeśli w danym miejscu nie ma źródła dźwięku i ktoś uważa, że tam miejscu coś słyszy to znaczy, że mu się zdaje.

W stereo dźwięk powinien być słyszalny z każdego miejsca pomiędzy głośnikami. Czy tak jest faktycznie? Zagadnienie jest bardziej skomplikowane, niż by się mogło wydawać. Po co jest głośnik centralny w systemach dźwięku przestrzennego? Skoro prawdą byłoby, że baza stereo faktycznie jest pomiędzy głośnikami, to głośnik centralny byłby bez sensu. Warto przypomnieć sobie, że identyczne źródła dźwięku powodują, że dokładnie w połowie odległości pomiędzy nimi powstaje cisza.

Umieszczenie pozornego źródła dźwięku w bazie stereo sprawia pewne trudności. Cóż dopiero, gdy dźwięk ma być słyszalny z miejsc, które są poza bazą? Jak już zostało powiedziane dźwięk słychać z miejsca, gdzie jest jego źródło. Realizatorzy potrafią jednak "zamarkować" miejsce wydobywania się dźwięku poza bazą stereo.

Słuch koduje informacje przestrzenne przy pomocy małżowin. Ich specyficzny kształt powoduje, że dźwięki napływające z różnych kierunków są w pewien sposób filtrowane. Jeśli realizator nada dźwiękowi barwę taką, która powstaje przy dochodzeniu z określonego kierunku można uzyskać złudzenie, że źródło dźwięku jest np. powyżej głośników lub z tyłu. Jednak nie zawsze się to sprawdza, bo każdy ma uszy o innym kształcie i efekt będzie działać tylko na wybrane osoby. Tak czy inaczej kształtowanie barwy dźwięku w celu imitowania kodowania przestrzennego daje raczej marne efekty. Najlepiej sprawdza się, jeśli opis płyty "podpowiada" z jakiego kierunku słuchacz powinien dźwięki słyszeć. Jeszcze lepiej, jeśli są rysunki.

Poszerzenie bazy stereo jest tak stare, jak radiomagnetofony. Dodanie części sygnału z przeciwnego kanału i w przeciwfazie pozwala sztucznie rozszerzyć bazę poza głośniki. Jednak jeśli się przesadzi to dźwięk wydaje się być "wywrócony na lewą stronę" i nienaturalny.

Efekt "przestrzenności" uzyskuje się przez dodanie opóźnień, ale największy udział w tym ma sam pokój, w którym się słucha. Odbicia, które docierają do słuchacza z opóźnieniem powodują, że dźwięk nabiera powietrza i trójwymiarowości. Efekt najlepiej jest słyszalny w akustyce łazienki, tzn. w silnych odbiciach. Im lepsza akustyka czyli odbicia są słabsze, tym efekt przestrzenności zanika. W optymalnych warunkach czyli w strefie wolnej od odbić dźwięk jest słyszalny tylko z głośników i w zakresie bazy stereo, a żadnego wrażenia trójwymiarowości nie ma. Jeśli realizator zastosuje któryś z omówionych tricków służących do wywołania wrażenia dobiegania dźwięku z jakiegoś nietypowego kierunku, to też jest on raczej mało przekonujący, z tym wyjątkiem kiedy słuchacz ma akurat odpowiedni kształt ucha.

Jeśli słucha się w pomieszczeniu z silnymi odbiciami efekt przestrzenności polega na tym, że dźwięk słychać głównie z głośników, ale poza tym z każdego kierunki, bo odbija się wszędzie o wszystko. Silne odbicia są czymś na granicy, której słuch nie potrafi rozróżnić, czy to odbicie, czy już echo. Skoro ani to ani tamto, więc słuch decyduje, że dźwięk pochodzi z każdego kierunku, więc jest "przestrzenny". Dźwięk bezpośredni kotwiczy kierunek, tylko odbicia są kodowane jako dochodzące zewsząd.

Wszystkie opisy dotyczące holograficznego dźwięku itp. są skutkiem złej akustyki. Chociaż czasem nawet zawodowi akustycy zajmujący się adaptacją pomieszczeń pozostawiają trochę odbić poprzecznych, żeby dźwięk uzyskał nieco "przestrzeni".

wtorek, 16 sierpnia 2016

Jak dobrać moc wzmacniacza i kolumn c.d.

Dopasowanie kolumn do wzmacniacza nie jest ostatnio popularnym tematem. Na wstępie warto wspomnieć, że głośniki nie mają faktycznie żadnej mocy, mogą jedynie określoną moc przyjąć. W kwestii doboru wzmacniacza i kolumn istnieją dwie sprzeczne szkoły.

Szkoła starsza podaje, że moc wzmacniacza powinna być połową "mocy" kolumn. Ma to swoje uzasadnienie. Jeśli się mocno przesteruje wzmacniacz, to będzie on oddawał moc, gdy zasilacz jest wystarczająco wydajny, dwukrotnie większą od znamionowej. Mając więc wzmacniacz 2x100 można go przesterować do momentu, aż będzie oddawał 2x200W. Sygnał wyjściowy będzie przypominał przebieg prostokątny i zawierał nieparzyste harmoniczne. Poziom zniekształceń wzrośnie do około 40%.

W praktyce spektrum zakłóceń nie ma znaczenia i harmoniczne same w sobie nie stanowią jakiegoś szczególnego zagrożenia dla głośników. Energia coraz wyższych harmonicznych szybko spada. Ważna jest ogólna moc sygnału. Przesterowując wzmacniacz 2x100 do mocy 2x200W jest duża szansa na uszkodzenie kolumn mogących przetwarzać np. 130W. Jednak możliwość uszkodzenia kolumn przesterowanym słabszym wzmacniaczem jest znacznie mniejsza niż wtedy, kiedy będzie używany wzmacniacz dużo silniejszy niż kolumny.

Jeśli do dyspozycji są kolumny o mocy szczytowej 130W i wzmacniacz 200W na kanał przy głośniejszym słuchaniu bardzo łatwo jest przesadzić z mocą i spalić głośniki. O ile słaby wzmacniacz przy przesterowaniu zniekształca dźwięk, to silny dostarczy bez żadnych zniekształceń moc większą niż są w stanie znieść głośniki. W podanym przykładzie można mieć czysty sygnał o mocy 200W a więc 70W więcej niż mogą przyjąć głośniki. I dlatego, żeby spalić głośniki słabym wzmacniaczem trzeba wyjątkowego uporu, gdyż słysząc zniekształcony dźwięk odruchowo zmniejsza się głośność. Natomiast słuchanie głośno kiedy dźwięk brzmi dość czysto często zachęca do jej zwiększenia, co zazwyczaj nie kończy się dla głośników dobrze.

Dlatego nowsza szkoła twierdząca, że wzmacniacz powinien mieć moc większą niż głośniki bazuje raczej na tym, że te ostatnie będą mieć skuteczne zabezpieczenia chroniące przed przeciążeniem.

Na koniec warto wspomnieć, że moce rzędu 15-20W są wystarczające, żeby przy długotrwałym słuchaniu stracić stopniowo słuch.

wtorek, 26 lipca 2016

Zapętlenie zakłóceń

Opisywanie zjawisk akustycznych polega na próbie ujęcia zjawiska odbywającego się w pewnym sensie w wielu wymiarach jednocześnie. Odbicia dźwięku są zapętlone dlatego, że chociaż dźwięk odbija się sukcesywnie pokonując coraz większy dystans, a to zajmuje pewien czas, ale jednak wszystkie odbicia z tego przedziału czasowego nakładają się na dźwięk bezpośredni jednocześnie.


Na rysunku są zaznaczone odbicia, które pojawią się po tym jak dźwięk źródłowy ustanie. Odbicia po pewnym okresie zanikają, aż pozostaje tylko tło szumu otoczenia. Jednak słuchając muzyki ona wciąż gra, bez przerwy, dlatego każdy rodzaj odbić, od pierwszych po późniejsze, aż do całkowitego rozproszenia czyli włączając w to także szum tła, są obecne jednocześnie.

Każde zdarzenie dźwiękowe skutkuje odbiciami dźwięku. Faktycznie te zdarzenia należałoby narysować jako nakładające się na siebie. Jeśli się je rozbije na elementy składowe, łatwo zauważyć, że w chwili T występuje pełne spektrum odbić. Wobec tego w każdym momencie na dźwięk bezpośredni nakładają się wszystkie rodzaje odbić jakie występują w pomieszczeniu począwszy od bezpośrednich, najgłośniejszych, aż do ogona pogłosowego i szumu. Rysunek przedstawia bardzo niewielką ilość dźwięków odbitych. W rzeczywistości wszystko dzieje się z większą szybkością i "gęstością". Same dźwięki nie mają charakteru impulsowego, ale zazwyczaj charakteryzuje je dość długi okres stanu ustalonego, który trwa często nawet więcej niż sekundę. Jak widać żaden dźwięk nie będzie słyszany bez nakładających się odbić, jedynie ostatni będzie wolny od pogłosu wywołanego pierwszym dźwiękiem.

Dlatego, że w czasie słuchania muzyki wszystkie odbicia są obecne permanentnie, więc wszystkie jednocześnie nakładają się na każdy moment odtwarzania. Dlatego właśnie, że odbicia są zapętlone w czasie, trzeba o nich myśleć właśnie jak o wszystkich naraz nakładających się na każdą chwilę nagrania. Więc nakłada się na muzykę całkiem sporo śmieci.

Wobec tego widać, że zakłócenia mają prawie taką samą głośność jak sygnał. W związku z tym, że zakłócenia mają głośność zbliżoną do oryginalnego sygnału ktoś może stwierdzić, że to niemożliwe, bo przecież to by było słychać, a nie słychać.

Słychać, ale budowa i działanie ucha jest specyficzna i uwzględnia tak wysoki poziom zakłóceń, że słyszenie w takich warunkach jest możliwe i subiektywnie sprawia wrażenie, że żadnych zakłóceń nie ma.

Jak to się dzieje zostało już opisane we wcześniejszych postach.

poniedziałek, 18 lipca 2016

Problem z pozostaniem na Ziemi czyli jitter 20 pikosekund

Czy ktoś czytał kiedyś deklaracje jakiegoś audiofila, że słyszy jitter 2 pikosekund? A może artykuł o tym, że można usłyszeć jitter 20 pikosekund? Jeśli nie, to nie ma problemu. Problem mają autorzy. Pierwszy ma zbyt wybujałą wyobraźnię, a drugi źle zinterpretował wyniki obliczeń.

Jak można dojść do tak absurdalnego wniosku, że jitter 20 pikosekund jest słyszalny? W ten sposób, że nakładając poziom zakłóceń na krzywą Fletchera-Munsella trafia on dokładnie na sam dół krzywej poziomu słyszalności. Czyli zakłócenie ma poziom prawie -10 dB. Warto pamiętać, że 0 dB SPL nie znaczy, że zmiany w ciśnieniu wynoszą zero, więc stąd biorą się ujemne db. Faktycznie taki poziom dźwięku można usłyszeć w komorze bezechowej, gdzie panuje absolutna cisza. Pytanie jest jednak następujące: poziom zakłóceń to około -10 dB, a co z sygnałem?

Jitter 20 pikosekund ma głośność tak małą, że jest najmniejszą głośnością, którą można w ogóle słyszeć. Nie jest zaznaczony na rysunku, ale wypada w najniższym punkcie najniższego wykresu tuż nad osią. Tak cichych dźwięków można nie usłyszeć nigdy o ile się nie było w komorze dźwiękoszczelnej. Hałas otoczenia rzadko kiedy jest mniejszy niż 30 dB chyba, że ktoś mieszka w jaskini w środku puszczy.

Zniekształcenia nie istnieją w oderwaniu od przetwarzanego sygnału. Jeśli są zniekształcenia, to jest też sygnał, który został zniekształcony. Dlatego takie teoretyzowanie, że jeśli człowiek - chyba bardzo młody i zdrowy, dodajmy - słyszy poniżej zera dB, tzn. słyszy ujemne decybele, to nie znaczy, że usłyszy taki poziom zakłóceń. Nie usłyszy, bo fundamentalna będzie stokilkadziesiąt dB głośniejsza.

Żeby rzecz była jasna. Ktoś umyślił sobie, że skoro zakłócenia są na poziomie jeszcze słyszalnym, to po usunięciu sygnału je się da usłyszeć. Ale problem w tym, że musi grać muzyka, żeby były zakłócenia. Nie ma opcji wyciszenia muzyki, czyli zlikwidowanie sygnału, po to, żeby słuchać samych zakłóceń.

Można usłyszeć odgłos przeskakującej iskry w świecy zapłonowej, ale na to trzeba ją wykręcić z silnika. Natomiast nie da się tego usłyszeć, jak silnik pracuje.

To jest właśnie problem teoretyków. Tak jak nie ma sensu mówić o odgłosach świecy bez pracy silnika, tak nie ma sensu mówić o zakłóceniach bez sygnału czy muzyki.

W dobrej jakości przetworniku jitter rzędu 200 ps jest bardzo dobrą wartością i z całą pewnością jest niemożliwy do usłyszenia.

0,1 ns = 100 ps.

piątek, 15 lipca 2016

Współdzielenie częstotliwości

Dwa przedmioty materialne raczej nie mogą zajmować jednocześnie w tej samej przestrzeni, natomiast fale mogą. Do litrowego naczynia można wlać litr płynu i więcej się w objętości naczynia nie zmieści. Jeśli chodzi o fale, można wlać do litrowej przestrzeni litr fal, potem następny litr i okaże się, że dalej jest litr, albo ze jest pusto.

Fale cechuje to, że jednocześnie w tej samej przestrzeni może ich być wiele. Słyszymy np. kontrabas i skrzypce. W tej samej przestrzeni i w tym samym czasie są fale o różnych częstotliwościach.

Fala dźwiękowa jest zmianą ciśnienia atmosferycznego, a więc przedmiotem materialnym, i dotyczą jej te same reguły, które mówią, że dwa przedmioty materialne nie mogą się znaleźć jednocześnie w tym samym miejscu. Ale wcześniej zostało powiedziane, że mogą. Fale różnych częstotliwości mogą znaleźć się jednocześnie w tej samej przestrzeni. Nie mogą się znajdować jednocześnie w tej samej przestrzeni różne fale o takiej samej częstotliwości.

Można zsumować ze sobą ton 1 kHz i 440 Hz. Nie ma żadnego problemu, żeby następnie odfiltrować jedno od drugiego. Nie jest możliwe zsumowanie ze sobą dwu przebiegów o tej samej częstotliwości i ich ponowne rozdzielenie. Jeśli zsumujemy dwa tony 1 kHz o różnych amplitudach otrzymamy ton 1 kHz o amplitudzie większej, mniejszej, takiej samej lub ciszę. W zależności od miejsca "spotkania" w przestrzeni ciśnienie będzie się dodawać lub znosić.

Jeśli połączy się dwa realne dźwięki, których spektrum częściowo się pokrywa, dojdzie do sytuacji, kiedy dwa obiekty zajmują tą samą przestrzeń. Wobec tego dublujące się sinusoidy o jednakowych częstotliwościach nałożą się na siebie i zredukują do jednej.

Jeśli dźwięk zawiera 10 sinusoid, a inny dźwięk również zawiera 10 sinusoid i jeśli po 5 sinusoid w każdym z dźwięków ma tą samą częstotliwość, to po ich połączeniu otrzymamy sumę zawierającą 15 sinusoid. To znaczy jeśli np. pierwszy dźwięk będzie miał częstotliwości ABCDEFGHIJ a drugiego FGHIJKLMNO to po zsumowaniu obu nie otrzymamy dźwięku ABCDEFGHIJFGHIJKLMNO  tylko dźwięk ABCDEFGHIJKLMNO. Przykładowo jeśli oba dźwięki mają w sobie ton 1 kHz, to suma tych dźwięków nie będzie zawierać dwóch tonów 1 kHz tylko jeden będący ich sumą, albo tej częstotliwości zabraknie.

Dodanie dwóch lub więcej dźwięków nie oznacza podwojenia lub zwielokrotnienia. Część wspólna zostanie zmodyfikowana. Dźwięki wzajemnie wpływają na siebie i zmieniają tym samym swą barwę, modulację itd. Efekt jest nieodwracalny i powoduje redukcję ilości informacji.

wtorek, 5 lipca 2016

Jak pozostać audiofilem

Zostać audiofilem jest łatwo. Sposób jest prosty, mianowicie trzeba się określić. Deklarujesz audiofilizm i zostajesz audiofilem. Natychmiast.

Bycie audiofilem polega na wszystkosłyszeniu.

Są ludzie, którzy poddają wszystkosłyszenie w wątpliwość. Często wykonują przeróżne testy. Bywa i tak, że w takich testach uczestniczy wiele osób. Setki, nawet tysiące.

Kiedy po wykonaniu badań i testów na wielu tysiącach osób okazuje się, że wszystkosłyszenie nie istnieje, a wszystkie pretensje audiofili są warte tylko tyle ile jest wart papier, na którym zostały napisane powstaje pewien dysonans. Dysonans pomiędzy światem realnym i wyobrażonym.

Wydawać by się mogło, że wobec faktów audiofilizm powinien przestać istnieć. Wprawdzie dotyczy on coraz węższego grona osób, ale jednak istnieje.

Co zatem robią audiofile, skoro nie mają żadnych argumentów? Skoro przez pięćdziesiąt lat żadnemu audiofilowi nie udało się potwierdzić nigdy i w żaden sposób swoich pretensji do wszystkosłyszenia?

Audiofile nie czytają dokumentów przeczących ich tezom. A jak już je czytają, to czytają je w sposób dość szczególny. Przykładowo ktoś miał coś usłyszeć. Wykonał 100 prób i 50 razy się pomylił. Ktoś inny pomylił się 51 razy. Ale znalazł się ktoś, kto zgadł 51 razy. W związku z tym audiofile ogłaszają całemu światu, że wszystkosłyszenie istnieje.

Ciekawa sprawa, że wszystkie testy polegają na odróżnieniu próbki A od próbki B. W związku z tym zawsze szansa na zgadniecie wynosi 50/50. Takie same rezultaty można osiągnąć rzucając monetą. Jednak czemuś nikt nie wpadł na pomysł żeby odróżniać A od B i od C oraz od D. Powiedzmy są do odróżnienia próbki mp3, AAC, CD i tzw. "dźwięk o wysokiej rozdzielczości".

Mając cztery próbki już nie da się mówić o rzucie monetą. Albo słyszysz, albo nie. A przecież audiofile twierdząc, że pomiędzy CD i high-resolution jest różnica jak pomiędzy dniem i nocą, no to powinni odróżniać jedno od drugiego... i trzeciego i czwartego.

Ale takiego testu nie zrobi nikt. Nigdy.

Rezultat takiego testu z czterema próbkami zawsze będzie tylko jeden. Audiofile nie słyszą nic, żadnych różnic. A wszystkie ich pretensje można potłuc o kant, powiedzmy, obłości.

Ale póki co muszą ignorować fakty.

Aby im to zadanie ułatwić działy marketingu pracują w dzień i chyba nawet w nocy.

DODANE 6 lipca.

Jeśli 4 próbki to za dużo, to można robić test z trzema: ABCX. Chodzi o to, żeby zlikwidować podobieństwo wyników do rzutu monetą. W teście z trzema próbkami nie można uzyskać wyniku 50% jeśli się zgaduje i w ogóle nic nie słucha.

Wykonanie testu z czterema próbkami dźwięku nawet kilka razy z rzędu, nie potrzeba nawet wykonać 10 prób, wykaże, że testowani nie potrafią usłyszeć żadnych różnic.

sobota, 2 lipca 2016

Integracja odbić dźwięku

W każdym pomieszczeniu mieszkalnym dźwięk odbija się wielokrotnie. Jednak w pomieszczeniach o typowych rozmiarach tych odbić nie słychać prawie wcale. Można klasnąć w dłonie i przekonać się, że faktycznie "coś słychać" poza klaśnięciem, jednak w czasie rozmowy, wykonywania różnych czynności, a zwłaszcza w podczas słuchania muzyki odbić nie słychać.

Problem w dyskusjach dotyczących jakości odtwarzania muzyki polega na tym, że właśnie dlatego, że odbić nie słychać traktuje się je jako niewystępujące i przyjmuje, że słyszy się wszystko, co odtwarzają głośniki w czystej formie czyli przez nic niezakłóconej. Z drugiej strony wiadomo, że pomieszczenie można podzielić na 3 strefy, przy czym w strefie dalekiego odsłuchu występują zasadniczo same odbicia. Ponadto wrażenia odsłuchowe w strefie dźwięku bezpośredniego i w strefie dalekiej są zbliżone. Nawet słuchając muzyki w pokoju obok słyszy się wyraźnie większość instrumentów i wokali, a ze zrozumieniem mowy nie ma żadnych kłopotów.

Wobec tego, że w strefie dalekiej dźwięk bezpośredni może stanowić 0,001%, a wrażenia słuchowe są takie, że odbić nie słychać jakby ich w ogóle nie było, niektórzy przyjmują, że słuch eliminując odbicia odrzuca 99,999% wszystkich bodźców słuchowych. Wyeliminowanie praktycznie rzecz biorąc całości dźwięku w taki sposób, że pozostały minimalny ułamek brzmi czysto, wyraźnie i dobrze oddaje wrażenie dźwięku bezpośredniego jest niewykonalne.

"Wyczyszczenie" czyli odrzucenie 99,999% zakłóceń nie jest możliwe przy użyciu jakiejkolwiek, techniki obliczeniowej. To jest niewykonalne przede wszystkim z tego powodu, że w czasie analizy dźwięku nie da się ustalić co jest dźwiękiem bezpośrednim, a co odbitym. Natomiast można zintegrować odbicia w taki sposób, że otrzyma się w wyniku tego procesu dźwięk sprawiający wrażenie bezpośredniego.

Nie jest możliwe, że słuch eliminuje 99,999% wrażeń akustycznych, np. żeby uniknąć przeciążenia sensorycznego. Faktycznie, gdyby każdy dźwięk był słyszany kilkaset razy, byłoby to bardzo uciążliwe. Ponadto każde odbicie dociera z innego miejsca, więc stracilibyśmy możliwość ustalenia kierunku, bo byłoby słyszane kilkaset razy za każdym razem z innej strony. Również nie jest prawdą, że słyszy się tylko dźwięk bezpośredni.

Nałożenie na siebie tylko trzech sygnałów sinusoidalnych daje w efekcie coś zupełnie nieprzypominającego elementy składowe.

Rys. 1. Sygnał kompleksowy składający się z trzech sinusoid.

Podział sygnału na pasma pokazuje co składa się na dany dźwięk. Dzieląc dźwięk na pasma wiadomo, że w określonym czasie występują sinusoidy o określonych częstotliwościach i amplitudach. Problem w tym, że nie będziemy mieć żadnych danych co do tego, w którym momencie dana sinusoida jest początkiem jednego dźwięku i równocześnie końcem innego. Żeby wiedzieć kiedy dany dźwięk zaczyna się i kończy czyli jak długo trwa, trzeba go słuchać jako sygnał kompleksowy i słuchać świadomie. Taką zdolnością nie jest obdarzony żaden program komputerowy i dlatego nie można napisać algorytmu "kasującego" odbicia i "pozostawiającego" tylko dźwięk bezpośredni.

Załóżmy, że słuchamy dźwięku z rysunku 2, który jest faktycznie trójdźwiękiem składającym się z częstotliwości 1760, 880 i 440 Hz. Jeśli w trójdźwięku są zsumowane 3 sinusoidy o różnych częstotliwościach, tak samo dźwięk bezpośredni i odbicia będą się składać z tych trzech częstotliwości. Jeśli wykonalibyśmy podział na pasma słyszanego dźwięku, czyli sumy odbić, to w każdym z pasm zobaczylibyśmy taki przebieg:

Rys. 2. Fluktuacja amplitudy sygnału w wybranym paśmie spowodowana nakładaniem się na siebie odbić. Grafika pokazuje przykładowe fluktuacje dla częstotliwości 880 Hz, dla pozostałych częstotliwości z rysunku 2, tzn. 1760 i 440 Hz wykres byłby bardzo podobny.

Dlatego, że odbicia docierają w pewnych odstępach czasu i pokonują różne drogi są poprzesuwane w fazie. Niektóre odbicia, zwłaszcza najwcześniejsze, będą zgodne w fazie, więc będą się wzmacniały, inne będą się znosiły. Dlatego w każdym paśmie zauważymy pewną fluktuację głośności.

Gdyby słuch miał większą rozdzielczość w odniesieniu do tych szybkich skoków amplitudy, to moglibyśmy słyszeć, kiedy docierają do nas poszczególne odbicia. Możliwa jest jednak modulacja amplitudy, której słuch nie jest w stanie wykryć.


Rys. 3. słyszenie zmian w amplitudzie tonu 1 kHz i szumu białego.

Dla głośności 40 dB nie są słyszalne modulacje poziomu o wartości 6%. Im sygnał jest głośniejszy, tym mniejsza modulacja jest zauważalna.

Słuch jest dość mało czuły na krótko trwające impulsy. Dźwięk trwający krótko musi być znacznie głośniejszy niż identyczny dźwięk, który jest dłuższy. Również czułość na transjenty nie jest mocną stroną słuchu. Krótkie transjenty muszą być głośniejsze od porównywalnych dłuższych dźwięków.

Elementem anatomicznym pełniącym funkcję podzielenia sygnału kompleksowego na pasma (czyli wykonanie FFT) i złagodzenia mikro-fluktuacji (modulacji) amplitudy jest ślimak.

Rys. 4. Ślimak.

Rysunek przedstawia różne miejsca na błonie podstawnej, które odpowiadają za przetwarzanie określonych częstotliwości. Ślimak jest elementem w którym następuje podział na pasma, bo inne miejsca odpowiadają za przetwarzanie innej częstotliwości, natomiast różna długość słupka cieczy i różna podatność błony podstawnej oraz zmieniające się dynamicznie właściwości przetwarzania drgań przez komórki słuchowe powodują, że dla każdej częstotliwości występuje inny stopień tłumienia mikrofluktuacji amplitudy.

Z powyższego wynika, że w wyniku zmniejszenia możliwości śledzenia zmian amplitudy sygnału można doprowadzić to tego, że sumaryczny sygnał zebrany w nerwie słuchowym będzie sprawiał wrażenie, jakby dźwięk był pozbawiony odbić i składał się tylko z dźwięku bezpośredniego. Dlatego, że nie zdajemy sobie sprawy, że docierają do nas wciąż nowe odbicia, a wydaje się nam, że słyszymy jeden dźwięk, również nie zdając sobie sprawy z występowania odbić nie wiemy, że docierają one za każdym razem z innego kierunku. Dlatego źródło takiego mechanizmu słyszenia nie ma swej przyczyny w tym, żeby nie rozróżniać odbić i nie dlatego, żeby nie słyszeć tego samego dźwięku jako wiele jego kopii, ale po to, żeby nie dezorientowały nas różne kierunki, z których te odbicia docierają. Konieczność uzyskania jednoznacznej informacji co do lokalizacji źródła dźwięku jako produkt uboczny daje to, że nie słyszymy powtórzeń.

O ile hipoteza o wpływie dodatkowej masy cieczy w ślimaku, podatności błony podstawnej itd. może być faktycznym wyjaśnieniem zjawiska, możliwe jest jednak, że te czynniki nie mają znaczenia, dlatego że odbicia następują w minimalnych odstępach czasu. Pomiędzy czasem dotarcia do organu słuchu poszczególnych odbić są różnice mierzone w tysięcznych częściach sekundy.

Integracja odbić nie jest jedynym zjawiskiem psychoakustycznym. Również nie należy interpretować tego w ten sposób, że skoro prawie 100% dźwięków to odbicia, to zostaną one zsumowane do czegoś przypominającego dźwięk bezpośredni. Najważniejszym czynnikiem powodującym, że nie słychać powtórzeń jest maskowanie. Zamaskowane jest wszystko, co jest cichsze od dźwięku głównego o około 50 dB. Ponadto integracja odbić ma miejsce tylko w czasie trwania dźwięku źródłowego i trwa jeszcze tylko przez kilkadziesiąt ms po jego ustaniu. Kiedy dźwięk zasadniczy się urwie usłyszymy odbicia bez problemu, chociaż również nie wszystkie, bo jedne odbicia, te silniejsze, będą maskować słabsze.

poniedziałek, 27 czerwca 2016

Realizacja dźwięku - ciekawy efekt placebo

Nie tylko odbiorcy muzyki ulegają złudzeniom. Wystarczy zmiana koloru jakiegoś elementu zestawu i już inne brzmienie ktoś sobie... wyobraża. Wyobrażają sobie różne rzeczy realizatorzy dźwięku jak najbardziej. Czasem kręcą gałkami urządzeń, które w ogóle nie są wpięte w tor i słyszą zmiany. W ogóle trudno jest realizatorowi podejść obiektywnie do swej pracy. Zasiada dumnie na swym tronie przed szeroką na kilka metrów konsoletą, po bokach i gdzieś jeszcze z tyłu tona drogich sprzętów, on wielce słyszący wszystko złotouchy geniusz, który poustawiał wszystkie gały i heble w sposób najpotymalniejszy na świecie i dźwięk jego realizacji przyćmiewa wszystkie dokonania wszystkich realizatorów we wszechświecie. A wszystkie sprzęty piękne są. Światełka świecą, wskaźniki się bujają, ekraniki wyświetlają. Jak to wszystko pięknie wygląda.

A zwykły człowiek w domu nie widząc tego całego przepychu i nie wiedząc, że realizuje dźwięk skończony geniusz słuchając tego twierdzi, że brzmi to jakby pies szczekał swoją budą.

Dodane 26.02.2016

Loudness War zaczęła się po roku 1980 i trwa do dziś. Odpowiedzialni za to są realizatorzy dźwięku. To właśnie oni wynaleźli wszystkie metody powodujące zohydzenie brzmienia.

Loudness War to nie tylko problem głośności. Zwiększyć głośności nie można bez zniekształcenia dźwięki. Te wszystkie zniekształcenia, które czynią większość wydawnictw nieznośnymi w odbiorze, są skutkiem działalności realizatorów dźwięku.

Loudness War w radio także jest skutkiem działalności realizatorów. Za granicą większość stacji po wprowadzeniu nowych przepisów zaczęła brzmieć co najmniej znośnie. Polscy realizatorzy są wyjątkowo odporni na zmiany. Prędzej Bolek przyzna się do bycia Bolkiem niż polski realizator odzyska słuch.

Monstrualnie brzmiący lektor w filmach to skutek działania realizatora dźwięku.

Monstrualne brzmienie kanałów telewizyjnych to skutek działania realizatorów dźwięku.

Polski realizator nie spocznie, dopóki wszystkiego nie spieprzy. Nie zaśnie dopóki nie stwierdzi, że słuchacz radia lub telewidz nie porzyga się słuchając skutków jego "pracy".

W sumie ma to dobre skutki. Coraz więcej ludzi rezygnuje ze słuchania radia i oglądania telewizji.

wtorek, 21 czerwca 2016

Było sobie ucho

Porównanie ucha z mikrofonem wykazuje występowanie zasadniczych różnic w budowie i zasadzie działania. Właściwym narządem słuchu jest Narząd Cortiego. Jeśli przyjmiemy, że będzie on odpowiadał cewce, a błona bębenkowa membranie okazuje się, że w uchu występuje kilka elementów, których nie znajdziemy w żadnym typie mikrofonu:

1. Młoteczek.
2. Kowadełko.
3. Strzemiączko.
4. Ślimak

Kostki słuchowe tworzą przekładnię dopasowującą impedancję różnych ośrodków. Każda kostka ma masę, sztywność, częstotliwość rezonansową itd. która wpływa na działanie całości.

Zasada działania ucha jest taka, jakby na tubie patefonu umieścić przetworniki piezoelektryczne, zamiast połączyć je bezpośrednio z igłą. Jednak to nie wszystko. Gdyby igłę połączyć z tubą układem dźwigni, a na tubie umieścić przetworniki piezoelektryczne, dopiero wtedy powstałoby urządzenie działające i zbudowane dokładnie tak jak ucho. Z punktu widzenia techniki Hi-Fi to nie ma żadnego sensu.

Zanim drgania błony bębenkowej zostaną przekształcone w impulsy elektryczne przez komórki słuchowe, muszą przejść dwa etapy transkrypcji drgań z jednego ośrodka do drugiego, a drgania błony bębenkowej zostają zastąpione przez odpowiedź ślimaka. Wynika z tego, że tak naprawdę słyszymy nie to, co dotarło do ucha, ale reakcję ślimaka.

Do uzyskania maksymalnej precyzji ucho powinno być zbudowane w ten sposób, że komórki słuchowe są połączone bezpośrednio z bębenkiem. Jednak wykorzystanie elementu pośredniczącego jest konieczne, w przeciwnym razie dźwięk słyszany tak jak przez mikrofon byłby całkowicie nieczytelny.

sobota, 4 czerwca 2016

Słuchawki - dlaczego nie? I dlaczego nie.

Dobry odbiór muzyki w niezaadaptowanym pomieszczeniu nie jest możliwy. Rozwiązaniem problemów z transmisją dźwięku mogłoby być użycie słuchawek, jednak taki odsłuch jest  często niesatysfakcjonujący i wybiera się głośniki w pomieszczeniu złym akustycznie.

Często odsłuch głośnikowy odbywa się w strefie dalekiej, gdzie przeważają odbicia, wobec tego słuchawki eliminujące je do zera powinny brzmieć bezkonkurencyjnie. Wiadomo jednak, że słuchawki nie zawsze dobrze grają.

Wiele typów słuchawek jest źle zrównoważonych tonalnie i zazwyczaj mają za bardzo uwypuklone basy.

Warto poświęcić trochę wysiłku i znaleźć słuchawki o wyrównanej charakterystyce, ale w przystępnej cenie. Przy czym opisy brzmienia są nieprzydatne, trzeba mieć dostęp do pomiarów. Im charakterystyka bardziej płaska, tym lepiej.

Trzeba jednak zwrócić uwagę na sposób wykonania pomiarów. Zwyczajne pomierzenie charakterystyki nie da potrzebnych informacji, bo przetwornik jest przy samym uchu. Dlatego przydatne są te pomiary, gdzie wyraźnie zaznaczono, że są skompensowane. Jeśli pomiary są niekompensowane, trzeba mieć odpowiednią wiedzę i doświadczenie, żeby je zinterpretować.

Jest jeszcze jeden problem ze słuchawkami. Dużo nagrań nie nadaje się do takiego słuchania, po prostu realizator wykonał je w pomieszczeniu nie-neutralnym. W jego studio nagrania brzmiały dobrze, obiektywnie takie nie są. Zazwyczaj brakuje im przestrzenności. W reżyserce przestrzenność była, bo miała słabą adaptację, albo niedostateczną. Naprawdę dobre realizacje w słuchawkach brzmią bardzo przyjemnie.

Pozostaje jeszcze przyzwyczajenie do obecności silnych odbić pomieszczenia. Jeśli się jednak często słucha przez dobre słuchawki, można taki odbiór muzyki docenić. Obiektywnie jakość jest lepsza niż przez głośniki.