CLEAR算法基礎:ITU PEAQ標準
發(fā)布時間:2013/3/1 19:54:57 訪問次數(shù):1560
20世紀90年代早期,語音和音樂編AD1582BRTZ解碼器數(shù)目激增,但是,由于其內在的非線性和非平穩(wěn)性使得傳統(tǒng)測量方法(如頻率響應,THDN等)無法得到很好的結果,因此并沒有標準方法對其進行品質評價限定。
1994年,ITU要求幾家機構研究出可用于競爭比較的解決方案來衡量編解碼器的音頻性能。這些方法最終合成為一個方法稱為PEAQ(Perceptual Evaluationof Audio Quality,可感知音頻質量評價),并于1998年作為《ITU-R建議書BS. 1387-可感知音頻質量客觀測量方法》[13發(fā)表。盡管其主要針對編解碼器,但是此文件所提出的聽覺模型可以應用到任何設備,在ITU雜志首頁上明確表明了建議書的意見。圖7為PEAQ的一半框圖。值得注意的是,該模型產(chǎn)生了一個指標-ODG(客觀差異分級)。此簡單指標對實驗中信號可感知音頻質量與參考信號進行比較。
它們?yōu)镻EAQ算法的兩種變體,~個為基本的基于FFT的算法,另一個為將FFT和濾波器組結合的更高級算法;舅惴ǖ哪康氖菍崟r實現(xiàn),而更復雜高級算法的目的在于進行更深入的分析。
這兩種算法都將信號的連續(xù)時間框圖轉變?yōu)椤皟仍诒磉_”,即將聲音的響度沿著音調刻度分布。換言之,此模型將聲壓的時間一頻率分布轉換為響度的時間一音調分布。在從物理學轉變?yōu)樯韺W的過程中,聲能在音調軸和時間軸上均勻分布。音調軸的均勻分布模擬了頻率掩蔽,時間軸的均勻分布模擬了時間掩蔽。聽覺絕對閾值通過將人耳頻率權重和內部噪聲頻率相關補償相結合得到。此模型的輸出是激勵模式和作為時間一頻率函數(shù)的掩蔽閾值。不同模型的輸出變量最終整合在一個認知模型內,從而得到單一的質量指標。
20世紀90年代早期,語音和音樂編AD1582BRTZ解碼器數(shù)目激增,但是,由于其內在的非線性和非平穩(wěn)性使得傳統(tǒng)測量方法(如頻率響應,THDN等)無法得到很好的結果,因此并沒有標準方法對其進行品質評價限定。
1994年,ITU要求幾家機構研究出可用于競爭比較的解決方案來衡量編解碼器的音頻性能。這些方法最終合成為一個方法稱為PEAQ(Perceptual Evaluationof Audio Quality,可感知音頻質量評價),并于1998年作為《ITU-R建議書BS. 1387-可感知音頻質量客觀測量方法》[13發(fā)表。盡管其主要針對編解碼器,但是此文件所提出的聽覺模型可以應用到任何設備,在ITU雜志首頁上明確表明了建議書的意見。圖7為PEAQ的一半框圖。值得注意的是,該模型產(chǎn)生了一個指標-ODG(客觀差異分級)。此簡單指標對實驗中信號可感知音頻質量與參考信號進行比較。
它們?yōu)镻EAQ算法的兩種變體,~個為基本的基于FFT的算法,另一個為將FFT和濾波器組結合的更高級算法;舅惴ǖ哪康氖菍崟r實現(xiàn),而更復雜高級算法的目的在于進行更深入的分析。
這兩種算法都將信號的連續(xù)時間框圖轉變?yōu)椤皟仍诒磉_”,即將聲音的響度沿著音調刻度分布。換言之,此模型將聲壓的時間一頻率分布轉換為響度的時間一音調分布。在從物理學轉變?yōu)樯韺W的過程中,聲能在音調軸和時間軸上均勻分布。音調軸的均勻分布模擬了頻率掩蔽,時間軸的均勻分布模擬了時間掩蔽。聽覺絕對閾值通過將人耳頻率權重和內部噪聲頻率相關補償相結合得到。此模型的輸出是激勵模式和作為時間一頻率函數(shù)的掩蔽閾值。不同模型的輸出變量最終整合在一個認知模型內,從而得到單一的質量指標。
上一篇:心理聲學理論簡介
上一篇:ITU PEAQ標準原則的算法