VoIP中語(yǔ)音壓縮編碼技術(shù)的研究與性能分析
發(fā)布時(shí)間:2008/5/28 0:00:00 訪問(wèn)次數(shù):408
internet的巨大成功。必將使ip成為未來(lái)信息網(wǎng)絡(luò)的支柱技術(shù),以ip為核心的分組化和以移動(dòng)通信為核心的無(wú)線化已成為電信網(wǎng)絡(luò)演進(jìn)的主流方向。tcp/ip的網(wǎng)絡(luò)技術(shù)不但無(wú)可置疑地成為數(shù)據(jù)領(lǐng)域的主導(dǎo)技術(shù),而且已經(jīng)開(kāi)始進(jìn)入電信領(lǐng)域,其突破口就是電話業(yè)務(wù)。
ip網(wǎng)絡(luò)電話是一項(xiàng)涉及計(jì)算機(jī)網(wǎng)絡(luò)、信令協(xié)議、數(shù)字信號(hào)處理等多個(gè)領(lǐng)域的綜合性技術(shù),它具有價(jià)格低廉、可以靈活地提供各種增值業(yè)務(wù)、有利于企業(yè)建立高效綜合服務(wù)內(nèi)部網(wǎng)、有利于運(yùn)營(yíng)商開(kāi)拓新的市場(chǎng)、有助于和ip網(wǎng)絡(luò)新技術(shù)的融合、促進(jìn)網(wǎng)絡(luò)技術(shù)的發(fā)展等獨(dú)特的優(yōu)勢(shì)。其中價(jià)格低廉是ip電話能夠進(jìn)入市場(chǎng)的首要因素,其根本原因是ip電話均采用語(yǔ)音分組技術(shù)、語(yǔ)音壓縮編碼和統(tǒng)計(jì)復(fù)用,帶寬利用率高,完成一次通信所需的成本大幅度降低。ip電話中的語(yǔ)音處理主要需要解決兩個(gè)問(wèn)題:一是在保證一定話音質(zhì)量的前提下盡可能地降低編碼比特率,二是在ip網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量。前者正是我們要研究的語(yǔ)音編碼技術(shù)。
1、語(yǔ)音編碼技術(shù)
1.1 語(yǔ)音編碼技術(shù)的分類(lèi)
根據(jù)語(yǔ)音編碼的發(fā)展過(guò)程,把語(yǔ)音編碼技術(shù)歸納為以下3類(lèi):
1.1.1 波形編
碼
波形編碼方式是能夠忠實(shí)地表現(xiàn)波形的編碼方式。語(yǔ)音信號(hào)的波形編碼力圖使重建的語(yǔ)音波形保持原語(yǔ)音信號(hào)的波形狀態(tài)。這類(lèi)編碼器通常是將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,所以它具有適應(yīng)能力強(qiáng)、話音質(zhì)量好、抗噪抗誤碼能力強(qiáng)等特點(diǎn),但是波形編碼所需的編碼速率比較高,其速率一般在64 kbit/s~16 kbit/s。其中64 kbit/s pcm的語(yǔ)音編碼方式是其中的一個(gè)代表。
1.1.2 參數(shù)編碼
參數(shù)編碼是根據(jù)聲音的形成模型,把聲音變換成參數(shù)的編碼方式。其基本方法是通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取及編碼,力圖使重建語(yǔ)音信號(hào)具有盡可能高的可懂性,即保持原語(yǔ)音的語(yǔ)義。而重建的信號(hào)的波形同原語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。參數(shù)編碼的最大優(yōu)點(diǎn)是編碼速率低,通常小于 4.8kbit/s,有時(shí)可以低至600 bit/s~2.4 kbit/s。缺點(diǎn)是合成語(yǔ)音質(zhì)量差,自然度較低,對(duì)講話環(huán)境噪聲較敏感,且時(shí)延大。
參數(shù)編碼的典型例子就是語(yǔ)音信號(hào)的線性預(yù)測(cè)編碼(lpc),它已被公認(rèn)為是目前參數(shù)編碼中最有效的方法。
1.1.3 混合編碼
混合編碼結(jié)合了以上兩種編碼方式的優(yōu)點(diǎn),采用線性技術(shù)構(gòu)成聲道模型,不只傳輸預(yù)測(cè)參數(shù)和清濁音信息,而且預(yù)測(cè)誤差信息和預(yù)測(cè)參數(shù)同時(shí)傳輸,在接收端構(gòu)成新的激勵(lì)去激勵(lì)預(yù)測(cè)參數(shù)構(gòu)成的合成濾波器,使得合成濾波器輸出的信號(hào)波形與原始語(yǔ)聲信號(hào)的波形最大程度的擬合,從而獲得自然度較高的語(yǔ)聲。這種編碼技術(shù)的關(guān)鍵是:如何高效地傳輸預(yù)測(cè)誤差信息。依據(jù)對(duì)激勵(lì)信息的不同處理,這類(lèi)編碼主要有:多脈沖線性預(yù)測(cè)編碼(mplpc)、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(rpelpc)、碼激勵(lì)線性預(yù)測(cè)編碼(celpc)、低時(shí)延的碼激勵(lì)線性預(yù)測(cè)編碼(ld-celpc)。
混合編碼克服了原有波形編碼器與聲碼器的弱點(diǎn),而結(jié)合了它們的優(yōu)點(diǎn),在4 kbit/s~16 kbit/s速率上能夠得到高質(zhì)量合成語(yǔ)音。在本質(zhì)上具有波形編碼的優(yōu)點(diǎn),有一定抗噪和抗誤碼的性能,但時(shí)延較大。
1.2 語(yǔ)音壓縮編碼的原理
ip網(wǎng)絡(luò)電話中的語(yǔ)音處理需要解決的一個(gè)重要問(wèn)題就是在保證一定話音質(zhì)量的前提下,盡可能降低編碼比特率。這主要依靠語(yǔ)音編碼技術(shù)來(lái)解決。ip 電話宜使用itu-t定義的低比特率編碼標(biāo)準(zhǔn),其比特率為5.3 kbit/s~16 kbit/s,均為低復(fù)雜度編碼算法,話音分組長(zhǎng)度在30 ms以下,話音質(zhì)量較好。從前面列舉的幾種編碼方式也可看出,同一段語(yǔ)音信號(hào),采用不同的編碼方式,其編碼后的比特率各不相同。那么為什么我們能夠?qū)φZ(yǔ)音信號(hào)進(jìn)行壓縮編碼從而達(dá)到降低語(yǔ)音信號(hào)的比特率呢?
1.2.1 利用了語(yǔ)音信號(hào)的相關(guān)性
語(yǔ)音信源是相關(guān)信源,因此經(jīng)過(guò)采樣和量化的信號(hào)之間還有很強(qiáng)的相關(guān)性,為了降低編碼速率,人們就希望盡可能多地去除語(yǔ)音信號(hào)之間的相關(guān)性。線性預(yù)測(cè)編碼技術(shù)(lpc)就是一種用來(lái)去除語(yǔ)音信號(hào)之間相關(guān)性的常用技術(shù)。語(yǔ)音信號(hào)中存在兩種類(lèi)型的相關(guān)性:其一是在樣點(diǎn)之間短時(shí)相關(guān)性。語(yǔ)音信號(hào)在某些短時(shí)段中呈現(xiàn)出隨機(jī)噪聲的特性,在另一些短時(shí)段中,則呈現(xiàn)出周期信號(hào)的特性,其他一些是二者的混合。簡(jiǎn)而言之,語(yǔ)音信號(hào)的特征是隨時(shí)間而變化的,只是在一短段時(shí)間中,語(yǔ)音信號(hào)才保持相對(duì)穩(wěn)定一致的特征,也就是語(yǔ)音信號(hào)的短時(shí)平穩(wěn)性。其二是相鄰基音周期之間存在的長(zhǎng)時(shí)相關(guān)性。由于語(yǔ)音信號(hào)中的短時(shí)相關(guān)性和長(zhǎng)時(shí)相關(guān)性很強(qiáng),通過(guò)減弱這些相關(guān)性,使語(yǔ)音信號(hào)之間相關(guān)性降低,然后再進(jìn)行編碼,
internet的巨大成功。必將使ip成為未來(lái)信息網(wǎng)絡(luò)的支柱技術(shù),以ip為核心的分組化和以移動(dòng)通信為核心的無(wú)線化已成為電信網(wǎng)絡(luò)演進(jìn)的主流方向。tcp/ip的網(wǎng)絡(luò)技術(shù)不但無(wú)可置疑地成為數(shù)據(jù)領(lǐng)域的主導(dǎo)技術(shù),而且已經(jīng)開(kāi)始進(jìn)入電信領(lǐng)域,其突破口就是電話業(yè)務(wù)。
ip網(wǎng)絡(luò)電話是一項(xiàng)涉及計(jì)算機(jī)網(wǎng)絡(luò)、信令協(xié)議、數(shù)字信號(hào)處理等多個(gè)領(lǐng)域的綜合性技術(shù),它具有價(jià)格低廉、可以靈活地提供各種增值業(yè)務(wù)、有利于企業(yè)建立高效綜合服務(wù)內(nèi)部網(wǎng)、有利于運(yùn)營(yíng)商開(kāi)拓新的市場(chǎng)、有助于和ip網(wǎng)絡(luò)新技術(shù)的融合、促進(jìn)網(wǎng)絡(luò)技術(shù)的發(fā)展等獨(dú)特的優(yōu)勢(shì)。其中價(jià)格低廉是ip電話能夠進(jìn)入市場(chǎng)的首要因素,其根本原因是ip電話均采用語(yǔ)音分組技術(shù)、語(yǔ)音壓縮編碼和統(tǒng)計(jì)復(fù)用,帶寬利用率高,完成一次通信所需的成本大幅度降低。ip電話中的語(yǔ)音處理主要需要解決兩個(gè)問(wèn)題:一是在保證一定話音質(zhì)量的前提下盡可能地降低編碼比特率,二是在ip網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量。前者正是我們要研究的語(yǔ)音編碼技術(shù)。
1、語(yǔ)音編碼技術(shù)
1.1 語(yǔ)音編碼技術(shù)的分類(lèi)
根據(jù)語(yǔ)音編碼的發(fā)展過(guò)程,把語(yǔ)音編碼技術(shù)歸納為以下3類(lèi):
1.1.1 波形編
碼
波形編碼方式是能夠忠實(shí)地表現(xiàn)波形的編碼方式。語(yǔ)音信號(hào)的波形編碼力圖使重建的語(yǔ)音波形保持原語(yǔ)音信號(hào)的波形狀態(tài)。這類(lèi)編碼器通常是將語(yǔ)音信號(hào)作為一般的波形信號(hào)來(lái)處理,所以它具有適應(yīng)能力強(qiáng)、話音質(zhì)量好、抗噪抗誤碼能力強(qiáng)等特點(diǎn),但是波形編碼所需的編碼速率比較高,其速率一般在64 kbit/s~16 kbit/s。其中64 kbit/s pcm的語(yǔ)音編碼方式是其中的一個(gè)代表。
1.1.2 參數(shù)編碼
參數(shù)編碼是根據(jù)聲音的形成模型,把聲音變換成參數(shù)的編碼方式。其基本方法是通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取及編碼,力圖使重建語(yǔ)音信號(hào)具有盡可能高的可懂性,即保持原語(yǔ)音的語(yǔ)義。而重建的信號(hào)的波形同原語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的差別。參數(shù)編碼的最大優(yōu)點(diǎn)是編碼速率低,通常小于 4.8kbit/s,有時(shí)可以低至600 bit/s~2.4 kbit/s。缺點(diǎn)是合成語(yǔ)音質(zhì)量差,自然度較低,對(duì)講話環(huán)境噪聲較敏感,且時(shí)延大。
參數(shù)編碼的典型例子就是語(yǔ)音信號(hào)的線性預(yù)測(cè)編碼(lpc),它已被公認(rèn)為是目前參數(shù)編碼中最有效的方法。
1.1.3 混合編碼
混合編碼結(jié)合了以上兩種編碼方式的優(yōu)點(diǎn),采用線性技術(shù)構(gòu)成聲道模型,不只傳輸預(yù)測(cè)參數(shù)和清濁音信息,而且預(yù)測(cè)誤差信息和預(yù)測(cè)參數(shù)同時(shí)傳輸,在接收端構(gòu)成新的激勵(lì)去激勵(lì)預(yù)測(cè)參數(shù)構(gòu)成的合成濾波器,使得合成濾波器輸出的信號(hào)波形與原始語(yǔ)聲信號(hào)的波形最大程度的擬合,從而獲得自然度較高的語(yǔ)聲。這種編碼技術(shù)的關(guān)鍵是:如何高效地傳輸預(yù)測(cè)誤差信息。依據(jù)對(duì)激勵(lì)信息的不同處理,這類(lèi)編碼主要有:多脈沖線性預(yù)測(cè)編碼(mplpc)、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(rpelpc)、碼激勵(lì)線性預(yù)測(cè)編碼(celpc)、低時(shí)延的碼激勵(lì)線性預(yù)測(cè)編碼(ld-celpc)。
混合編碼克服了原有波形編碼器與聲碼器的弱點(diǎn),而結(jié)合了它們的優(yōu)點(diǎn),在4 kbit/s~16 kbit/s速率上能夠得到高質(zhì)量合成語(yǔ)音。在本質(zhì)上具有波形編碼的優(yōu)點(diǎn),有一定抗噪和抗誤碼的性能,但時(shí)延較大。
1.2 語(yǔ)音壓縮編碼的原理
ip網(wǎng)絡(luò)電話中的語(yǔ)音處理需要解決的一個(gè)重要問(wèn)題就是在保證一定話音質(zhì)量的前提下,盡可能降低編碼比特率。這主要依靠語(yǔ)音編碼技術(shù)來(lái)解決。ip 電話宜使用itu-t定義的低比特率編碼標(biāo)準(zhǔn),其比特率為5.3 kbit/s~16 kbit/s,均為低復(fù)雜度編碼算法,話音分組長(zhǎng)度在30 ms以下,話音質(zhì)量較好。從前面列舉的幾種編碼方式也可看出,同一段語(yǔ)音信號(hào),采用不同的編碼方式,其編碼后的比特率各不相同。那么為什么我們能夠?qū)φZ(yǔ)音信號(hào)進(jìn)行壓縮編碼從而達(dá)到降低語(yǔ)音信號(hào)的比特率呢?
1.2.1 利用了語(yǔ)音信號(hào)的相關(guān)性
語(yǔ)音信源是相關(guān)信源,因此經(jīng)過(guò)采樣和量化的信號(hào)之間還有很強(qiáng)的相關(guān)性,為了降低編碼速率,人們就希望盡可能多地去除語(yǔ)音信號(hào)之間的相關(guān)性。線性預(yù)測(cè)編碼技術(shù)(lpc)就是一種用來(lái)去除語(yǔ)音信號(hào)之間相關(guān)性的常用技術(shù)。語(yǔ)音信號(hào)中存在兩種類(lèi)型的相關(guān)性:其一是在樣點(diǎn)之間短時(shí)相關(guān)性。語(yǔ)音信號(hào)在某些短時(shí)段中呈現(xiàn)出隨機(jī)噪聲的特性,在另一些短時(shí)段中,則呈現(xiàn)出周期信號(hào)的特性,其他一些是二者的混合。簡(jiǎn)而言之,語(yǔ)音信號(hào)的特征是隨時(shí)間而變化的,只是在一短段時(shí)間中,語(yǔ)音信號(hào)才保持相對(duì)穩(wěn)定一致的特征,也就是語(yǔ)音信號(hào)的短時(shí)平穩(wěn)性。其二是相鄰基音周期之間存在的長(zhǎng)時(shí)相關(guān)性。由于語(yǔ)音信號(hào)中的短時(shí)相關(guān)性和長(zhǎng)時(shí)相關(guān)性很強(qiáng),通過(guò)減弱這些相關(guān)性,使語(yǔ)音信號(hào)之間相關(guān)性降低,然后再進(jìn)行編碼,
熱門(mén)點(diǎn)擊
- 基于CD4060的硬件看門(mén)狗技術(shù)
- 基于RFID技術(shù)的智能倉(cāng)庫(kù)管理系統(tǒng)
- 多路溫度采集及監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 用ROM實(shí)現(xiàn)組合邏輯函數(shù)
- ESD知識(shí)
- 城市軌道交通電力綜合監(jiān)控系統(tǒng)的結(jié)構(gòu)與網(wǎng)絡(luò)通信
- TI新一代OMAP2處理器支持WMV9與H.
- Cadence推出高級(jí)時(shí)序簽收分析系統(tǒng)Enc
- 能量管理系統(tǒng)(EMS)在湖州電網(wǎng)中的應(yīng)用
- LwIP協(xié)議在μC/OS操作系統(tǒng)中的實(shí)現(xiàn)
推薦技術(shù)資料
- 羅盤(pán)誤差及補(bǔ)償
- 造成羅盤(pán)誤差的主要因素有傳感器誤差、其他磁材料干擾等。... [詳細(xì)]
- EVL250WMG1L諧振轉(zhuǎn)換器應(yīng)用分析
- STGWA30IH160DF2
- 集成半橋 MOSFET 驅(qū)動(dòng)器
- 全新AI操作系統(tǒng)One UI
- 全新空間音頻標(biāo)準(zhǔn)—Eclipsa Audio
- RISC-V MCU+接口技術(shù)
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究