Model psychoakustyczny to matematyczny model mówiący jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.

Modele psychoakustyczne są szczególną grupą modeli układu słuchowego. W tej grupie wytyczne do modelowania pochodzą z pomiarów psychoakustycznych (odsłuchowych), w których słuchacze oceniają wrażenia wywołane różnymi sygnałami testowymi prezentowanymi w określonym kontekście (np. czy słyszą ton sinusoidalny prezentowany na tle szumu). Model przetwarza sygnał w taki sposób, aby jego wyjście stanowiło predykcję ocen subiektywnych słuchaczy. Zjawiskami słuchowymi najczęściej wykorzystywanymi przy opracowywaniu modeli psychoakustycznych są: maskowanie dźwięków, percepcja wysokości dźwięków oraz dyskryminacja modulacji amplitudy.

Najprostszym faktem psychoakustycznym jest różna czułość ludzkiego ucha na dźwięki o różnych częstotliwościach (niektórych częstotliwości np. bardzo wysokich lub bardzo niskich nie słyszymy w ogóle). W odpowiednich warunkach odsłuchowych możliwe jest przeprowadzenie testu pozwalającego na wyznaczenie charakterystyki czułości ucha ludzkiego na różne częstotliwości dźwięku oraz charakterystyk maskowania, które to elementy modelowania stanowią podstawę większości obecnych koderów stosujących kompresję stratną. Należy zauważyć, że nawet stosowanie tak prostych elementów jak miara decybelowa może być traktowane jako zastosowanie modelu psychoakustycznego (patrz: prawo Webera). Innym przykładem może być stosowanie w miernikach poziomu ciśnienia akustycznego krzywych korekcyjnych A, B i C modelujących percepcję dźwięków a będących przybliżeniem krzywych jednakowej głośności.

Modele psychoakustyczne przewidują zwykle zakres słyszalności od 20 Hz-20 kHz (dlatego właśnie większość współczesnych odtwarzaczy muzyki zapisanej cyfrowo ma takie pasmo przenoszenia) i maksymalną czułość w zakresie od 2 kHz do 4 kHz.

Ponadto uwzględnia się maskowanie jednych dźwięków przez inne:

  • maskowanie sÄ…siednich czÄ™stotliwoÅ›ci(maskowanie jednoczesne): ciche dźwiÄ™ki o czÄ™stotliwoÅ›ciach zbliżonych do czÄ™stotliwoÅ›ci dźwiÄ™ku gÅ‚oÅ›nego nie sÄ… sÅ‚yszalne
  • maskowanie dźwiÄ™ków nastÄ™pujÄ…cych (maskowanie pobodźcowe): gÅ‚oÅ›ny dźwiÄ™k potrafi zagÅ‚uszyć cichsze dźwiÄ™ki nastÄ™pujÄ…ce zaraz po nim
  • maskowanie dźwiÄ™ków poprzedzajÄ…cych (maskowanie wsteczne): cichy dźwiÄ™k poprzedzajÄ…cy w krótkim czasie dźwiÄ™k gÅ‚oÅ›ny nie jest sÅ‚yszalny - ta wÅ‚asność ukÅ‚adu sÅ‚uchowego jest szczególnie ciekawa, gdyż nie da siÄ™ jej wyjaÅ›nić na gruncie adaptacji krótkoterminowej ukÅ‚adu sÅ‚uchowego; równoczeÅ›nie pokazuje ona, że ukÅ‚ad sÅ‚uchowy nosi pewne cechy ukÅ‚adu nieprzyczynowego (problem nieprzyczynowoÅ›ci można rozwiÄ…zać, dopuszczajÄ…c pewne opóźnienie w odbiorze bodźców dźwiÄ™kowych).

edytuj Zobacz też