心理聲學(xué)(psychoacoustics)是研究聲音和它引起的聽覺之間關(guān)系的一門邊緣學(xué)科。心理聲學(xué)一詞似乎很令人費(fèi)解,其實(shí)很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強(qiáng)大的算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時(shí)輕輕地踏一下腳,您就會(huì)聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會(huì)減少信息量,減小文件的大小,但聽起來卻沒有區(qū)別。
原理
心理聲學(xué)模型是對(duì)人聽感的統(tǒng)計(jì)性質(zhì)的數(shù)學(xué)表述模型,它解釋人各種聽感的生理原理。
心理聲學(xué)模型可以在主觀聽感劣化不多的條件下,大大降低數(shù)字音頻信號(hào)傳輸?shù)膸挕K饕谌说穆犛X器官的生理結(jié)構(gòu)和感知模式,通過對(duì)數(shù)字音頻信號(hào)的相應(yīng)處理,去除不可聞的信號(hào)成分及引入不可聞的畸變,達(dá)到普通編碼無法達(dá)到的壓縮比率。
由于人耳聽覺系統(tǒng)復(fù)雜,人類迄今為止對(duì)它的機(jī)理和聽覺特性的某些問題總是還不能從生理解剖角度完全解釋清楚。所以,對(duì)人耳聽覺特性的研究僅限于在心理聲學(xué)和語言聲學(xué)內(nèi)進(jìn)行。人耳對(duì)不同強(qiáng)度和不同頻率聲音的一定聽覺范圍稱為聲域。在人耳的聲域范圍內(nèi),聲音聽覺心理的主觀感受主要有響度、音高、音色等特征和掩蔽效應(yīng)、高頻定位等特性。其中響度、音度、音色可以在主觀上用來描述具有振幅、頻率和相位三個(gè)物理是的任何復(fù)雜的聲音,故又稱為聲音“三要素”;而對(duì)于多種音源場(chǎng)合的人的耳掩蔽效應(yīng)等特性尤為重要,它是心理聲學(xué)的基礎(chǔ)。
研究聲音和它引起的聽覺之間關(guān)系的一門邊緣學(xué)科。它既是聲學(xué)的一個(gè)分支,也是心理物理學(xué)的一個(gè)分支。心理聲學(xué)本可包括言語和音樂這樣一些復(fù)合聲和它們的知覺。這些可見語言聲學(xué)、音樂聲學(xué)等條,本條只限于較基礎(chǔ)和簡單的心理聲學(xué)現(xiàn)象,即①剛剛能引起聽覺的聲音──聽閾;②聲音的強(qiáng)度、頻率、頻譜和時(shí)長這些參量所決定的聲音的主觀屬性──響度、音調(diào)、音色和音長;③某些和復(fù)合聲音有關(guān)的特殊的心理聲學(xué)效應(yīng)──余音、掩蔽、非線性、雙耳效應(yīng)。
與心理聲學(xué)對(duì)應(yīng)的光學(xué)分支是光度學(xué)與色度學(xué),它們分別科學(xué)地描述了人類視覺中對(duì)光強(qiáng)度與顏色的主觀感知。
分類
聽閾分強(qiáng)度閾和差閾。聲音不夠一定強(qiáng)度不能引起聽覺。在多次作用中能有50%的次數(shù)引起聽覺的最小聲壓級(jí)稱為強(qiáng)度閾(也稱聽閾)。聽閾有個(gè)體差異,因而所謂正常聽閾只能是一些聽力正常的年輕人的聽閾的統(tǒng)計(jì)平均值。聽閾隨頻率而變化。500~4000Hz之間閾值最低,在它們之上和之下的高頻聲和低頻聲的閾值都較高,如20Hz純音的閾值比1000Hz純音的閾值約高70dB,10000Hz純音的閾值也比 1000Hz純音的閾值約高10dB。最敏感的頻率是3000Hz左右,空氣分子振動(dòng)的振幅達(dá)到10-11m 就可以聽到,這只有氫氣分子的直徑的十分之一。聽閾隨年齡而增高,特別是高頻部分,表現(xiàn)為老年聾,如70歲的老人,5000Hz純音的聽閾約增高45dB。聽閾的概念還包括差閾,即兩個(gè)聲音引起聽覺差別的最小可覺差。就頻率說,在63Hz左右有經(jīng)驗(yàn)的人耳能區(qū)別相差0.5Hz的兩個(gè)純音的差別,但這種閾值在1000Hz要增加到1.4Hz,頻率越高差閾越大。人耳能區(qū)別的強(qiáng)度差值最小0.25dB(1000~4000Hz,70dB以上),強(qiáng)度低或頻率更高或更低時(shí),強(qiáng)度差閾更大。在整個(gè)聽覺范圍內(nèi),可辨別的聲音約34萬個(gè)。
主觀屬性
響度
表示的是一個(gè)聲音聽來有多響的程度。響度主要隨聲音的強(qiáng)度而變化,但也受頻率的影響。兩者的量的關(guān)系,按古典的心理物理學(xué)規(guī)律,響度與強(qiáng)度的對(duì)數(shù)成正比。為了檢驗(yàn)這一假說的正確性,現(xiàn)代心理物理學(xué)進(jìn)行了響度的定量判斷實(shí)驗(yàn),并建立了響度量表,其單位為宋(son)。1宋的定義為40dB1000Hz純音所引起的響度,大致相當(dāng)于耳語的聲級(jí)。宋量表證明,響度正比于 1000Hz等響聲壓的0.6次冪,就是說,1000Hz等響聲的聲壓級(jí)提高10dB,響度加倍。前者稱為響度級(jí),這說明響度的變化不是單純地決定于聲音強(qiáng)度,也與頻率有關(guān)。不同頻率的兩個(gè)純音,雖強(qiáng)度相同,引起的響度卻不同。總的說,中頻純音聽來比低頻和高頻純音響一些。以不同聲壓級(jí)的1000Hz純音為參照聲,通過響度平衡實(shí)驗(yàn),可以得到一簇等響線,如上圖所示。在一條等響線上,各頻率的純音盡管聲壓級(jí)不同,但都與該曲線上的1000Hz純音等響。1000Hz純音的這一聲壓級(jí)即定為此曲線上各純音的響度級(jí),其單位稱為方(phon)。
音調(diào)
音調(diào)是聲音聽來調(diào)子高低的程度。音調(diào)主要決定于聲音的頻率,它隨頻率的升降而升降。但是,它也不是單純地由頻率決定,與聲音強(qiáng)度也有關(guān)系。低頻純音的音調(diào)隨強(qiáng)度增加而下降;反之,高頻純音的音調(diào)卻隨強(qiáng)度增加而上升。類似響度的宋量表,也制定了音調(diào)量表。音調(diào)定量判斷實(shí)驗(yàn)是讓聽者調(diào)節(jié)發(fā)生器產(chǎn)生一系列純音,使它們?cè)谝粽{(diào)上聽來間隔相等。這樣取得的平均判斷構(gòu)成了音調(diào)量表,其單位稱為美。在此量表上,1000Hz純音的音調(diào)被定為1000美(mel)。
音色
音色是對(duì)聲音音質(zhì)的感覺。上面提過的純音不存在音色問題,它是伴隨復(fù)合聲出現(xiàn)的。明顯的例子是不同樂器所發(fā)出的聲音在音色上的不同。小提琴和鋼琴發(fā)出的中央C,盡管它們響度和音調(diào)相同,聽起來還是不一樣,原因在于它們音色的差異。聲音的音色決定于它們的頻譜,即聲音諧波振幅的不同。復(fù)合聲這種多量綱的特點(diǎn)使得音色也具有多量綱性,不同于只有單個(gè)量綱的響度和音調(diào)。響度可以在宋量表上定出由響到輕的程度,音調(diào)可以在美量表上定出由高到低的程度,音色則只能用多維空間上相應(yīng)的點(diǎn)來確定。言語聲的多維量表實(shí)驗(yàn)證明,音色的知覺空間上的點(diǎn)與頻譜的物理空間上的點(diǎn)是非常吻合的。
音長
音長是聲音長短的感覺。聲音的參量作為時(shí)間的函數(shù)只要有兩個(gè)清楚的變化便可產(chǎn)生主觀音長感覺。最簡單的例子是一個(gè)聲脈沖或一段休止,它們都只有一頭一尾的變化。很久以來,人們總以為音長和聲音的物理長短是相等的,忽視了對(duì)它的研究。其實(shí),在極端情況下兩者可相差四五倍之多。這是用脈沖聲和短于 500ms的休止所作的實(shí)驗(yàn)結(jié)果。音長受聲級(jí)的影響不大,但頻率對(duì)它的影響卻不可忽視,尤其是300ms以下的短聲。如果以3 200Hz的脈沖聲作參照,頻率在它上下的脈沖聲必須有較長的物理聲長才能產(chǎn)生相等的音長感覺。用這種音長平衡實(shí)驗(yàn)可以得到一簇類似于等響線的等音長線。
聲學(xué)效應(yīng)
余音
對(duì)于純音,聲音的音調(diào)主要決定于頻率,而對(duì)于由基波和諧波組成的復(fù)合聲,自H.von亥姆霍茲以來,普遍認(rèn)為復(fù)合聲的音調(diào)決定于基波的頻率,因?yàn)榛ǖ恼穹陬l譜中占優(yōu)勢(shì),而且給人的感覺也的確如此。但是實(shí)驗(yàn)表明,若復(fù)合聲的基頻很弱,甚至完全被濾掉,它的音調(diào)仍維持基頻的音調(diào)不變。這種失去基頻的音調(diào)被稱為余音。日常生活中也有余音效應(yīng)。人們的言語聲是以聲帶發(fā)出的低頻聲為基頻的。在電話中,它雖然被濾掉,說話的聲調(diào)并沒有受到影響。余音現(xiàn)象所以受到注意是因?yàn)樗婕暗揭粋€(gè)基本的聽覺理論問題,即音調(diào)究竟決定于頻率,還是決定于周期性。目前的研究還不能作出結(jié)論。
聲掩蔽
一個(gè)聲信號(hào)如果與一種噪聲同時(shí)出現(xiàn),它將變得微弱或完全聽不清楚,即是說信號(hào)的聽閾提高了。這就是掩蔽效應(yīng),噪聲掩蔽了信號(hào)。掩蔽效應(yīng)的大小取決于噪聲和信號(hào)在頻率上的關(guān)系。一般說,信號(hào)與噪聲的頻率越接近,掩蔽也越大,且低頻噪聲對(duì)高頻信號(hào)的掩蔽常大于高頻噪聲對(duì)低頻信號(hào)的掩蔽。通過帶寬可變的噪聲對(duì)純音信號(hào)的掩蔽實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)以 1000Hz為中心頻率的噪聲增加帶寬時(shí),它對(duì) 1000Hz純音信號(hào)的掩蔽效應(yīng)也隨著增加。但帶寬增至100Hz以后,再增加就對(duì)掩蔽的改變不起作用。就是說,這個(gè)噪聲的掩蔽作用只限制在這個(gè)頻帶內(nèi),以外的聲音無作用。這個(gè)100Hz的頻帶稱為臨界頻帶。它隨頻率的提高而加寬。
非線性
人耳的傳輸特性與其他換能器一樣,帶有一些非線性的特點(diǎn)。它的產(chǎn)物就是所謂“合音”的感覺。合音包括差音、和音兩種。差音的例子:當(dāng)兩個(gè)純音同時(shí)以400Hz和500Hz同時(shí)發(fā)出時(shí),仔細(xì)聽起來還有頻率為其差值(100)及其諧頻的差值(200,300)的音,這就是差音。和音的頻率則是原來兩純音頻率之和,在這一例子中就是900Hz。它與差音相似,不過較弱一些,音調(diào)高一些。此外,還有在適當(dāng)頻率和強(qiáng)度關(guān)系下一個(gè)音可以抑制或降低另一個(gè)音的響應(yīng)(感覺)。這些現(xiàn)象一般用耳蝸的非線性反應(yīng)解釋。
雙耳效應(yīng)很多聽覺效果,決定于人有兩只耳朵。聲源定位的主要因素為兩耳的時(shí)間差和強(qiáng)度差(見生理聲學(xué))。由于頭部、耳廓、外耳道等的共振、反射作用,使聽到的聲音頻譜受到調(diào)制。來自右邊的聲音先到達(dá)右耳,強(qiáng)度也比左耳收到的強(qiáng)。聲源方向常通過頭的轉(zhuǎn)動(dòng)確定。復(fù)合聲的定位比純音容易,純音,尤其是2000~3000Hz的純音,定位特別困難。例如蟋蟀科的唧唧聲就是這樣,雖然它還不是嚴(yán)格的純音。在可聽聲范圍內(nèi),耳廓的指向性不顯著,但對(duì)定位仍有作用。在低頻率,兩耳強(qiáng)度差別不大,定位主要靠相位因素或時(shí)間因素。在高頻率,相位變化復(fù)雜,強(qiáng)度差更為重要。在中頻,定位更依賴時(shí)間和強(qiáng)度的綜合作用。
參考資料 >