對(duì)線(xiàn)性預(yù)測(cè)語(yǔ)音解壓縮方法的探討
發(fā)布時(shí)間:2007/8/24 0:00:00 訪(fǎng)問(wèn)次數(shù):590
摘要:本文針對(duì)常見(jiàn)的語(yǔ)音壓縮方法,具體敘述了線(xiàn)性預(yù)測(cè)編碼的基本原理及具體格式,并對(duì)算法實(shí)現(xiàn)的軟件及硬件進(jìn)行了詳細(xì)的分析。
關(guān)鍵詞:線(xiàn)性預(yù)測(cè)編碼 格形濾波器 PWM MATLAB
引言
現(xiàn)實(shí)生活中,有大量語(yǔ)音數(shù)字存儲(chǔ)和傳輸、語(yǔ)音綜合、說(shuō)話(huà)人確認(rèn)和辨認(rèn)、語(yǔ)音識(shí)別的應(yīng)用,這些應(yīng)用需要處理的數(shù)據(jù)量很大,這必須采用一定的壓縮方法進(jìn)行處理。
對(duì)頻率范圍為300Hz——3000Hz的語(yǔ)音,諸如電腦語(yǔ)音圖書(shū)、真人發(fā)聲電子字典、語(yǔ)言學(xué)習(xí)機(jī)等,只需要一般的語(yǔ)音壓縮方法,而對(duì)20Hz——20KHz的音樂(lè),則需高級(jí)的壓縮方法。當(dāng)然,在選擇語(yǔ)音表示方法時(shí),數(shù)據(jù)壓縮率不是唯的考慮,還要考慮價(jià)格、表示的靈活性、語(yǔ)音考慮價(jià)格、表示的靈活性、語(yǔ)音的質(zhì)量等諸多因素。在選擇信號(hào)表示以及隨后作用的數(shù)字信號(hào)處理方法時(shí)最重要的考慮還是應(yīng)用的實(shí)際需要。
針對(duì)我們目前開(kāi)發(fā)的發(fā)音電子字典及語(yǔ)音學(xué)習(xí)機(jī)等產(chǎn)生,既需要音質(zhì)清晰又要價(jià)格便宜,我們考慮采用參數(shù)表示語(yǔ)音信號(hào)的LPC,MELP,CELP壓縮方法。
LPC(Linear Predictive Coding-線(xiàn)性預(yù)測(cè)編碼),是一種低速率的語(yǔ)音參數(shù)表示方法,它根據(jù)最小的方誤差的準(zhǔn)則,用過(guò)去的若干語(yǔ)音數(shù)字信號(hào)來(lái)預(yù)測(cè)當(dāng)前的語(yǔ)音信號(hào),將估算出來(lái)的語(yǔ)音參數(shù)送到語(yǔ)音合成模型后輸出語(yǔ)音;旌霞(lì)線(xiàn)性預(yù)測(cè)MELP和碼本激勵(lì)線(xiàn)性預(yù)測(cè)CELP也是基于線(xiàn)性預(yù)測(cè)上的語(yǔ)音壓縮方法,數(shù)據(jù)壓縮量銷(xiāo)遜于LPC,但因其語(yǔ)音數(shù)據(jù)的制作不需要專(zhuān)門(mén)的硬件與有經(jīng)驗(yàn)的調(diào)音人員,在語(yǔ)音產(chǎn)品的開(kāi)發(fā)中也得到了廣泛的應(yīng)用,本文重點(diǎn)描述LPC算法的軟件和硬件實(shí)現(xiàn)。
LPC原理簡(jiǎn)述
LPC語(yǔ)音編碼的基礎(chǔ)是語(yǔ)音產(chǎn)生模型,它模擬人的發(fā)生過(guò)程。在這個(gè)模型中,語(yǔ)音信號(hào)分為清音和濁間,在濁音時(shí)聲道中產(chǎn)生對(duì)應(yīng)音調(diào)周期的脈沖列,而在清音時(shí),則產(chǎn)生白噪聲序列,語(yǔ)音就是由這些激勵(lì)信號(hào)激勵(lì)一個(gè)自適應(yīng)濾波器(即全極點(diǎn)濾波器)產(chǎn)生的。
LPC濾波器的參數(shù)ak是通過(guò)線(xiàn)性預(yù)測(cè)的方法,即用若干過(guò)去的樣值預(yù)測(cè)當(dāng)前樣值提取的,預(yù)測(cè)值與真值之間的誤差滿(mǎn)足最小均方誤差準(zhǔn)則。參數(shù)隨時(shí)間逐幀更新,更新速率30~100次/秒,即幀移為10~33ms。在每幀之間對(duì)參數(shù)進(jìn)行內(nèi)插以適應(yīng)參數(shù)隨時(shí)間緩慢變化。
因此,LPC模型只需傳輸增益系數(shù),濁音和清音的判決信息、濁音音調(diào)和全極點(diǎn)濾波器的參數(shù){ak},k=1,…p,用超低BIT率便可實(shí)現(xiàn)語(yǔ)音信號(hào)的傳送。這種高壓縮率可以大大降低語(yǔ)音識(shí)別中的存儲(chǔ)量。
語(yǔ)音合成模型見(jiàn)圖1。
L
摘要:本文針對(duì)常見(jiàn)的語(yǔ)音壓縮方法,具體敘述了線(xiàn)性預(yù)測(cè)編碼的基本原理及具體格式,并對(duì)算法實(shí)現(xiàn)的軟件及硬件進(jìn)行了詳細(xì)的分析。
關(guān)鍵詞:線(xiàn)性預(yù)測(cè)編碼 格形濾波器 PWM MATLAB
引言
現(xiàn)實(shí)生活中,有大量語(yǔ)音數(shù)字存儲(chǔ)和傳輸、語(yǔ)音綜合、說(shuō)話(huà)人確認(rèn)和辨認(rèn)、語(yǔ)音識(shí)別的應(yīng)用,這些應(yīng)用需要處理的數(shù)據(jù)量很大,這必須采用一定的壓縮方法進(jìn)行處理。
對(duì)頻率范圍為300Hz——3000Hz的語(yǔ)音,諸如電腦語(yǔ)音圖書(shū)、真人發(fā)聲電子字典、語(yǔ)言學(xué)習(xí)機(jī)等,只需要一般的語(yǔ)音壓縮方法,而對(duì)20Hz——20KHz的音樂(lè),則需高級(jí)的壓縮方法。當(dāng)然,在選擇語(yǔ)音表示方法時(shí),數(shù)據(jù)壓縮率不是唯的考慮,還要考慮價(jià)格、表示的靈活性、語(yǔ)音考慮價(jià)格、表示的靈活性、語(yǔ)音的質(zhì)量等諸多因素。在選擇信號(hào)表示以及隨后作用的數(shù)字信號(hào)處理方法時(shí)最重要的考慮還是應(yīng)用的實(shí)際需要。
針對(duì)我們目前開(kāi)發(fā)的發(fā)音電子字典及語(yǔ)音學(xué)習(xí)機(jī)等產(chǎn)生,既需要音質(zhì)清晰又要價(jià)格便宜,我們考慮采用參數(shù)表示語(yǔ)音信號(hào)的LPC,MELP,CELP壓縮方法。
LPC(Linear Predictive Coding-線(xiàn)性預(yù)測(cè)編碼),是一種低速率的語(yǔ)音參數(shù)表示方法,它根據(jù)最小的方誤差的準(zhǔn)則,用過(guò)去的若干語(yǔ)音數(shù)字信號(hào)來(lái)預(yù)測(cè)當(dāng)前的語(yǔ)音信號(hào),將估算出來(lái)的語(yǔ)音參數(shù)送到語(yǔ)音合成模型后輸出語(yǔ)音;旌霞(lì)線(xiàn)性預(yù)測(cè)MELP和碼本激勵(lì)線(xiàn)性預(yù)測(cè)CELP也是基于線(xiàn)性預(yù)測(cè)上的語(yǔ)音壓縮方法,數(shù)據(jù)壓縮量銷(xiāo)遜于LPC,但因其語(yǔ)音數(shù)據(jù)的制作不需要專(zhuān)門(mén)的硬件與有經(jīng)驗(yàn)的調(diào)音人員,在語(yǔ)音產(chǎn)品的開(kāi)發(fā)中也得到了廣泛的應(yīng)用,本文重點(diǎn)描述LPC算法的軟件和硬件實(shí)現(xiàn)。
LPC原理簡(jiǎn)述
LPC語(yǔ)音編碼的基礎(chǔ)是語(yǔ)音產(chǎn)生模型,它模擬人的發(fā)生過(guò)程。在這個(gè)模型中,語(yǔ)音信號(hào)分為清音和濁間,在濁音時(shí)聲道中產(chǎn)生對(duì)應(yīng)音調(diào)周期的脈沖列,而在清音時(shí),則產(chǎn)生白噪聲序列,語(yǔ)音就是由這些激勵(lì)信號(hào)激勵(lì)一個(gè)自適應(yīng)濾波器(即全極點(diǎn)濾波器)產(chǎn)生的。
LPC濾波器的參數(shù)ak是通過(guò)線(xiàn)性預(yù)測(cè)的方法,即用若干過(guò)去的樣值預(yù)測(cè)當(dāng)前樣值提取的,預(yù)測(cè)值與真值之間的誤差滿(mǎn)足最小均方誤差準(zhǔn)則。參數(shù)隨時(shí)間逐幀更新,更新速率30~100次/秒,即幀移為10~33ms。在每幀之間對(duì)參數(shù)進(jìn)行內(nèi)插以適應(yīng)參數(shù)隨時(shí)間緩慢變化。
因此,LPC模型只需傳輸增益系數(shù),濁音和清音的判決信息、濁音音調(diào)和全極點(diǎn)濾波器的參數(shù){ak},k=1,…p,用超低BIT率便可實(shí)現(xiàn)語(yǔ)音信號(hào)的傳送。這種高壓縮率可以大大降低語(yǔ)音識(shí)別中的存儲(chǔ)量。
語(yǔ)音合成模型見(jiàn)圖1。
L
熱門(mén)點(diǎn)擊
- 嵌入式系統(tǒng)的技術(shù)特點(diǎn)及前景展望
- Motorola DSP及其開(kāi)發(fā)
- ADSP-2106X SHARC DSPs軟
- eCAN模塊與SJA1000的應(yīng)用比較
- 16分鐘單片語(yǔ)音錄放電路ISD4004
- 通用有源濾波器UAF42的CAD軟件-FIL
- 一種基于DSP的逆變電源并聯(lián)運(yùn)行控制系統(tǒng)
- 二進(jìn)制數(shù)折半查找算法在DSP上的實(shí)現(xiàn)
- 高速多通道同步DSP數(shù)據(jù)采集系統(tǒng)
- DTMF電話(huà)語(yǔ)音接收器BU8874/BU88
推薦技術(shù)資料
- 業(yè)余條件下PCM2702
- PGM2702采用SSOP28封裝,引腳小而密,EP3... [詳細(xì)]
- CV/CC InnoSwitch3-AQ 開(kāi)
- URF1DxxM-60WR3系
- 1-6W URA24xxN-x
- 閉環(huán)磁通門(mén)信號(hào)調(diào)節(jié)芯片NSDRV401
- SK-RiSC-SOM-H27X-V1.1應(yīng)
- RISC技術(shù)8位微控制器參數(shù)設(shè)
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究