一種增強的LPC參數(shù)多級矢量量化技術(shù)
發(fā)布時間:2008/5/27 0:00:00 訪問次數(shù):509
    
    矢量量化(vector quantization)是一種極其重要的信號壓縮方法,廣泛應(yīng)用于語音、圖像信號壓縮等領(lǐng)域。信息論的一個分支——“率-畸變理論”指出,無論對于何種信息源,即使是無記憶的信息源(即各個采樣信號之間互相統(tǒng)計獨立),矢量量化總是優(yōu)于標(biāo)量量化,且矢量維數(shù)越大優(yōu)度越高。因此,目前國內(nèi)外對于矢量量化技術(shù)的研究非常廣泛而深入。平衡考慮量化效果和運算復(fù)雜度,多級矢量量化(msvq)提供了一個很好的折衷辦法。
    線性預(yù)測編碼(lpc)參數(shù)能很好地表征語音信號的短時譜包絡(luò)信息,在各種lpc參數(shù)中,線譜頻率(lsf)[1]較其它參數(shù)能更有效地表達(dá)lpc信息。k.k.paliwal和b.s.atal仔細(xì)研究了用24~26個比特量化一個10階lsf參數(shù)的方法,提出了分裂矢量量化(split vector quantization)和多級矢量量化msvq(multistage vector quantization)兩種方案,并且試驗得到了用25比特的2級msvq能取得較好的量化效果(平均失真1db,2~4db概率小于2%,大于4db為0)。
    msvq算法有效減小了碼本容量,但如果在量化比特有限的情況下,想取得透明的量化效果,必須解決兩個問題:(1)怎樣搜索碼本得到最佳匹配索引;(2)怎樣設(shè)計碼本。在算法設(shè)計中這兩個問題必須統(tǒng)一考慮。對前一個問題,為了方便一般采用序列搜索算法,依次搜索得到各級的最佳匹配矢量。在碼本設(shè)計中,更多的也是分級依次進(jìn)行碼本訓(xùn)練,割裂了各級碼本之間的相關(guān)性。本文將著重研究多級矢量量化的聯(lián)合優(yōu)化碼本設(shè)計問題。
    
    1 問題分析
    傳統(tǒng)的msvq算法在lsf參數(shù)碼本設(shè)計時采用一種連續(xù)(stage-by-stage)的設(shè)計方法,第k級碼本只與前面的第1至第(k-1)級碼本有關(guān),而不考慮后續(xù)各級碼本,即將后續(xù)各級碼本內(nèi)容視為0。在量化時,同樣只在本級尋找1個最佳匹配矢量,然后得到余量矢量送入下一級量化。量化過程可以用式(1)表示,假設(shè)有2級碼本,需要找出各級碼本索引:
    
    
    其中,k1和k2是第一、二級的碼本容量。最終量化結(jié)果為:
    
    
    在序列搜索算法中,搜索yi時,假設(shè)zj為0,搜索zj時yi已經(jīng)固定。這樣的搜索算法顯然是一種次優(yōu)的搜索算法,解決這個問題的方法是全搜索[3]。全搜索是最優(yōu)的搜索算法,但是其計算復(fù)雜度卻是難以承受的。例如,一個25比特2級碼本(13-12結(jié)構(gòu)),其全搜索復(fù)雜度是上述連續(xù)搜索的2000倍以上。m進(jìn)制搜索[4]折衷解決了這個問題。在運算量大大減小的情況下,取得了逼近全搜索的量化效果。
    在碼本設(shè)計中,無論是經(jīng)典的gla算法還是改進(jìn)的模擬退火(sa)算法,碼本設(shè)計都是逐級連續(xù)進(jìn)行的。利用各級碼本之間的相關(guān)性優(yōu)化碼本設(shè)計,可以較明顯地改善msvq的量化效果。在應(yīng)用聯(lián)合碼本設(shè)計方法量化音頻dct系數(shù)時,已經(jīng)取得了大約0.4 db的snr改善[5]。本文在量化lsf參數(shù)時,對比300步的sr算法,得到了大約0.05db、約1bit的加權(quán)對數(shù)譜失真(wlsd)[6]的改進(jìn)效果。
    2 算法說明
    2.1 失真距離量度
    對一個msvq碼本,為方便考慮假設(shè)共有2級碼本。lsf參數(shù)為10維矢量。對lsf參數(shù)而言,其敏感矩陣(sensitivity matrix)是對角陣,因此可以用加權(quán)最小均方誤差(wmse)代替加權(quán)對數(shù)譜失真(wlsd)作為失真量度[6]。量化失真
    
    
    
    其中,wi為功率譜幅度加權(quán),ci為lsf參數(shù)人耳聽覺加權(quán)。
    
    
    r的經(jīng)驗值一般為0.15。
    2.2 理論推導(dǎo)
    對一個訓(xùn)練矢量集x和兩級碼本y、z,可以對x中每個矢量進(jìn)行2級全搜索,得到最佳索引值對(i,j)。根據(jù)i和j的不同可以對x中每個矢量進(jìn)行聚類。假設(shè)s為對第一級碼字形成的聚類,si為所有x中第一級量化索引為i的訓(xùn)練矢量集合。同樣假設(shè)r為第二級碼字聚類,可知,{s1,s2,…,sk1}和{r1,r2,…,rk2}均是同一x集合的不同劃分。對于x∈si,平均量化失真為:
    
    
    
     z的輸入為(x-y),因此(5)式也可表達(dá)
    
    矢量量化(vector quantization)是一種極其重要的信號壓縮方法,廣泛應(yīng)用于語音、圖像信號壓縮等領(lǐng)域。信息論的一個分支——“率-畸變理論”指出,無論對于何種信息源,即使是無記憶的信息源(即各個采樣信號之間互相統(tǒng)計獨立),矢量量化總是優(yōu)于標(biāo)量量化,且矢量維數(shù)越大優(yōu)度越高。因此,目前國內(nèi)外對于矢量量化技術(shù)的研究非常廣泛而深入。平衡考慮量化效果和運算復(fù)雜度,多級矢量量化(msvq)提供了一個很好的折衷辦法。
    線性預(yù)測編碼(lpc)參數(shù)能很好地表征語音信號的短時譜包絡(luò)信息,在各種lpc參數(shù)中,線譜頻率(lsf)[1]較其它參數(shù)能更有效地表達(dá)lpc信息。k.k.paliwal和b.s.atal仔細(xì)研究了用24~26個比特量化一個10階lsf參數(shù)的方法,提出了分裂矢量量化(split vector quantization)和多級矢量量化msvq(multistage vector quantization)兩種方案,并且試驗得到了用25比特的2級msvq能取得較好的量化效果(平均失真1db,2~4db概率小于2%,大于4db為0)。
    msvq算法有效減小了碼本容量,但如果在量化比特有限的情況下,想取得透明的量化效果,必須解決兩個問題:(1)怎樣搜索碼本得到最佳匹配索引;(2)怎樣設(shè)計碼本。在算法設(shè)計中這兩個問題必須統(tǒng)一考慮。對前一個問題,為了方便一般采用序列搜索算法,依次搜索得到各級的最佳匹配矢量。在碼本設(shè)計中,更多的也是分級依次進(jìn)行碼本訓(xùn)練,割裂了各級碼本之間的相關(guān)性。本文將著重研究多級矢量量化的聯(lián)合優(yōu)化碼本設(shè)計問題。
    
    1 問題分析
    傳統(tǒng)的msvq算法在lsf參數(shù)碼本設(shè)計時采用一種連續(xù)(stage-by-stage)的設(shè)計方法,第k級碼本只與前面的第1至第(k-1)級碼本有關(guān),而不考慮后續(xù)各級碼本,即將后續(xù)各級碼本內(nèi)容視為0。在量化時,同樣只在本級尋找1個最佳匹配矢量,然后得到余量矢量送入下一級量化。量化過程可以用式(1)表示,假設(shè)有2級碼本,需要找出各級碼本索引:
    
    
    其中,k1和k2是第一、二級的碼本容量。最終量化結(jié)果為:
    
    
    在序列搜索算法中,搜索yi時,假設(shè)zj為0,搜索zj時yi已經(jīng)固定。這樣的搜索算法顯然是一種次優(yōu)的搜索算法,解決這個問題的方法是全搜索[3]。全搜索是最優(yōu)的搜索算法,但是其計算復(fù)雜度卻是難以承受的。例如,一個25比特2級碼本(13-12結(jié)構(gòu)),其全搜索復(fù)雜度是上述連續(xù)搜索的2000倍以上。m進(jìn)制搜索[4]折衷解決了這個問題。在運算量大大減小的情況下,取得了逼近全搜索的量化效果。
    在碼本設(shè)計中,無論是經(jīng)典的gla算法還是改進(jìn)的模擬退火(sa)算法,碼本設(shè)計都是逐級連續(xù)進(jìn)行的。利用各級碼本之間的相關(guān)性優(yōu)化碼本設(shè)計,可以較明顯地改善msvq的量化效果。在應(yīng)用聯(lián)合碼本設(shè)計方法量化音頻dct系數(shù)時,已經(jīng)取得了大約0.4 db的snr改善[5]。本文在量化lsf參數(shù)時,對比300步的sr算法,得到了大約0.05db、約1bit的加權(quán)對數(shù)譜失真(wlsd)[6]的改進(jìn)效果。
    2 算法說明
    2.1 失真距離量度
    對一個msvq碼本,為方便考慮假設(shè)共有2級碼本。lsf參數(shù)為10維矢量。對lsf參數(shù)而言,其敏感矩陣(sensitivity matrix)是對角陣,因此可以用加權(quán)最小均方誤差(wmse)代替加權(quán)對數(shù)譜失真(wlsd)作為失真量度[6]。量化失真
    
    
    
    其中,wi為功率譜幅度加權(quán),ci為lsf參數(shù)人耳聽覺加權(quán)。
    
    
    r的經(jīng)驗值一般為0.15。
    2.2 理論推導(dǎo)
    對一個訓(xùn)練矢量集x和兩級碼本y、z,可以對x中每個矢量進(jìn)行2級全搜索,得到最佳索引值對(i,j)。根據(jù)i和j的不同可以對x中每個矢量進(jìn)行聚類。假設(shè)s為對第一級碼字形成的聚類,si為所有x中第一級量化索引為i的訓(xùn)練矢量集合。同樣假設(shè)r為第二級碼字聚類,可知,{s1,s2,…,sk1}和{r1,r2,…,rk2}均是同一x集合的不同劃分。對于x∈si,平均量化失真為:
    
    
    
     z的輸入為(x-y),因此(5)式也可表達(dá)
熱門點擊
- HF-90H超小型跳頻短波電臺
- 2.4~2.5GHz ISM頻段WLAN用C
- 在單雙絞線上實現(xiàn)全雙工
- 如何快速判斷你的網(wǎng)段內(nèi)誰的網(wǎng)卡處在混雜模式
- 基于免費軟件ns2的網(wǎng)絡(luò)仿真
- Myrinet系統(tǒng)軟件GM分析
- 用MC3371/MC3372設(shè)計的濾波器
- 使用國產(chǎn)SDH芯片實現(xiàn)環(huán)網(wǎng)絡(luò)自愈
- 船載交換式網(wǎng)絡(luò)使用雙冗余網(wǎng)卡對網(wǎng)絡(luò)性能的影響
- 遠(yuǎn)距離多機分時雙工通信芯片SR331
推薦技術(shù)資料
- AMOLED顯示驅(qū)動芯片關(guān)鍵技
- CMOS圖像傳感器技術(shù)參數(shù)設(shè)計
- GB300 超級芯片應(yīng)用需求分
- 4NP 工藝NVIDIA Bl
- GB300 芯片、NVL72
- 首個最新高端芯片人工智能服務(wù)器
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究