嵌入式TTS漢語(yǔ)語(yǔ)音系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2007/4/23 0:00:00 訪問(wèn)次數(shù):737
采用波形編輯法的嵌入式TTS系統(tǒng)由于成本低、性能完善、自然度高,隨著波形修改算法的不斷提出以及微處理器和非易失性存儲(chǔ)介質(zhì)功能的不斷增強(qiáng),正日益受到人們的關(guān)注。本系統(tǒng)即采用時(shí)域波形編輯技術(shù),采集GB2312漢字編碼字符集中所有字符發(fā)音作為原始材料,通過(guò)使用改進(jìn)的游程編碼算法壓縮生成可適用于當(dāng)前Flash存儲(chǔ)器的語(yǔ)音庫(kù),并采用多重查找表設(shè)計(jì)及預(yù)存儲(chǔ)命令字技術(shù)有效地加快語(yǔ)音庫(kù)的尋址速度,在基于Atmel公司的AT89S52單片機(jī)上成功實(shí)現(xiàn)了一個(gè)TTS語(yǔ)音系統(tǒng),經(jīng)測(cè)試取得了令人滿意的效果。該系統(tǒng)應(yīng)用簡(jiǎn)便,具有很小的尺寸和很低的功耗及通用的串行接口,可以廣泛用于有關(guān)的漢語(yǔ)語(yǔ)音應(yīng)用系統(tǒng)中。
圖1為系統(tǒng)原理圖框圖以及主要操作流程。系統(tǒng)采用串行口與外界交互,任何具有標(biāo)準(zhǔn)串口的設(shè)備均可與本系統(tǒng)相連。欲發(fā)音漢字的國(guó)標(biāo)碼(GB碼)由串口送入MCU,MCU將其映射為Flash存儲(chǔ)器地址表中對(duì)應(yīng)項(xiàng)的地址,然后根據(jù)此地址取得對(duì)應(yīng)項(xiàng)中的命令字,由MCU根據(jù)該命令字讀取該漢字發(fā)音對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),連續(xù)讀出語(yǔ)音數(shù)據(jù)并以游程碼解碼算法解碼后,按照語(yǔ)音采樣時(shí)的固定速率通過(guò)D/A轉(zhuǎn)換和功率放大播放。本文中語(yǔ)音采樣速率為11025B/s。為滿足應(yīng)用需求,本文首先構(gòu)建易于快速解碼的語(yǔ)音庫(kù),根據(jù)特定Flash存儲(chǔ)器的存儲(chǔ)格式,以快速多查找表尋址及命令字預(yù)先存儲(chǔ)的方式組織并存儲(chǔ)在Flash存儲(chǔ)器中,以滿足語(yǔ)音播放的實(shí)時(shí)要求。同樣,MCU的代碼也要優(yōu)先考慮速度而犧牲諸如模塊化、可讀性方面的要求。最后,出于實(shí)用性考慮,系統(tǒng)中需加入足夠的輸入緩沖區(qū)支持,以滿足一次輸入多個(gè)流字或整句的要求。
2 原始語(yǔ)音數(shù)據(jù)的采集和處理
本系統(tǒng)共采集了1335種發(fā)音,內(nèi)含1306個(gè)流字發(fā)音,26個(gè)英文字母發(fā)音及3個(gè)停頓音,語(yǔ)音采集卡AD轉(zhuǎn)換整編11025B/s,分辨率8位,樣本值域0~255,靜默值為80H。原始語(yǔ)音以WAV文件的格式保存在PC機(jī)中。
本文根據(jù)上述靜默值及邊緣值的分布特點(diǎn),提出了一種改進(jìn)的游程編碼用于語(yǔ)音數(shù)據(jù)的壓縮,具體做法是:用00H代表游程壓縮起始碼,其后是被編碼字符,再下一個(gè)字節(jié)是被編碼字符的重復(fù)碼,如:80 80 80 80 80可以表示為00 80 05。顯然,游程長(zhǎng)度小于等于3時(shí)沒(méi)有編碼的必要,因而不會(huì)出現(xiàn)值為00H、01H和02H的重復(fù)碼。如上所述,在原始語(yǔ)音文件中,00H、01H這些邊緣值是基本上不出現(xiàn)的。因?yàn)榇罅砍霈F(xiàn)這些邊緣值即意味著語(yǔ)音采集系統(tǒng)的動(dòng)態(tài)范圍設(shè)置錯(cuò)誤。盡管如此,為確
采用波形編輯法的嵌入式TTS系統(tǒng)由于成本低、性能完善、自然度高,隨著波形修改算法的不斷提出以及微處理器和非易失性存儲(chǔ)介質(zhì)功能的不斷增強(qiáng),正日益受到人們的關(guān)注。本系統(tǒng)即采用時(shí)域波形編輯技術(shù),采集GB2312漢字編碼字符集中所有字符發(fā)音作為原始材料,通過(guò)使用改進(jìn)的游程編碼算法壓縮生成可適用于當(dāng)前Flash存儲(chǔ)器的語(yǔ)音庫(kù),并采用多重查找表設(shè)計(jì)及預(yù)存儲(chǔ)命令字技術(shù)有效地加快語(yǔ)音庫(kù)的尋址速度,在基于Atmel公司的AT89S52單片機(jī)上成功實(shí)現(xiàn)了一個(gè)TTS語(yǔ)音系統(tǒng),經(jīng)測(cè)試取得了令人滿意的效果。該系統(tǒng)應(yīng)用簡(jiǎn)便,具有很小的尺寸和很低的功耗及通用的串行接口,可以廣泛用于有關(guān)的漢語(yǔ)語(yǔ)音應(yīng)用系統(tǒng)中。
圖1為系統(tǒng)原理圖框圖以及主要操作流程。系統(tǒng)采用串行口與外界交互,任何具有標(biāo)準(zhǔn)串口的設(shè)備均可與本系統(tǒng)相連。欲發(fā)音漢字的國(guó)標(biāo)碼(GB碼)由串口送入MCU,MCU將其映射為Flash存儲(chǔ)器地址表中對(duì)應(yīng)項(xiàng)的地址,然后根據(jù)此地址取得對(duì)應(yīng)項(xiàng)中的命令字,由MCU根據(jù)該命令字讀取該漢字發(fā)音對(duì)應(yīng)的語(yǔ)音數(shù)據(jù),連續(xù)讀出語(yǔ)音數(shù)據(jù)并以游程碼解碼算法解碼后,按照語(yǔ)音采樣時(shí)的固定速率通過(guò)D/A轉(zhuǎn)換和功率放大播放。本文中語(yǔ)音采樣速率為11025B/s。為滿足應(yīng)用需求,本文首先構(gòu)建易于快速解碼的語(yǔ)音庫(kù),根據(jù)特定Flash存儲(chǔ)器的存儲(chǔ)格式,以快速多查找表尋址及命令字預(yù)先存儲(chǔ)的方式組織并存儲(chǔ)在Flash存儲(chǔ)器中,以滿足語(yǔ)音播放的實(shí)時(shí)要求。同樣,MCU的代碼也要優(yōu)先考慮速度而犧牲諸如模塊化、可讀性方面的要求。最后,出于實(shí)用性考慮,系統(tǒng)中需加入足夠的輸入緩沖區(qū)支持,以滿足一次輸入多個(gè)流字或整句的要求。
2 原始語(yǔ)音數(shù)據(jù)的采集和處理
本系統(tǒng)共采集了1335種發(fā)音,內(nèi)含1306個(gè)流字發(fā)音,26個(gè)英文字母發(fā)音及3個(gè)停頓音,語(yǔ)音采集卡AD轉(zhuǎn)換整編11025B/s,分辨率8位,樣本值域0~255,靜默值為80H。原始語(yǔ)音以WAV文件的格式保存在PC機(jī)中。
本文根據(jù)上述靜默值及邊緣值的分布特點(diǎn),提出了一種改進(jìn)的游程編碼用于語(yǔ)音數(shù)據(jù)的壓縮,具體做法是:用00H代表游程壓縮起始碼,其后是被編碼字符,再下一個(gè)字節(jié)是被編碼字符的重復(fù)碼,如:80 80 80 80 80可以表示為00 80 05。顯然,游程長(zhǎng)度小于等于3時(shí)沒(méi)有編碼的必要,因而不會(huì)出現(xiàn)值為00H、01H和02H的重復(fù)碼。如上所述,在原始語(yǔ)音文件中,00H、01H這些邊緣值是基本上不出現(xiàn)的。因?yàn)榇罅砍霈F(xiàn)這些邊緣值即意味著語(yǔ)音采集系統(tǒng)的動(dòng)態(tài)范圍設(shè)置錯(cuò)誤。盡管如此,為確
熱門點(diǎn)擊
- 傅立葉電子推出支持philipslpc22x
- IARSystems發(fā)布ARMTrace解決
- 高分辨率顏色傳感器TCS230的原理和應(yīng)用
- SN65HVD230型CAN總線收發(fā)器的原理
- MIPS新型多線程解決方案
- 基于ARM與μClinux的RTU設(shè)計(jì)
- QuickLogic嵌入式SDIOIP和SD
- 單線數(shù)字溫度傳感器DS18B20的原理與應(yīng)用
- Actel專為FPGA而優(yōu)化的軟ARM處理器
- xScale應(yīng)用程序性能的優(yōu)化策略
推薦技術(shù)資料
- DFRobot—玩的就是
- 如果說(shuō)新車間的特點(diǎn)是“靈動(dòng)”,F(xiàn)QPF12N60C那么... [詳細(xì)]
- AMOLED顯示驅(qū)動(dòng)芯片關(guān)鍵技
- CMOS圖像傳感器技術(shù)參數(shù)設(shè)計(jì)
- GB300 超級(jí)芯片應(yīng)用需求分
- 4NP 工藝NVIDIA Bl
- GB300 芯片、NVL72
- 首個(gè)最新高端芯片人工智能服務(wù)器
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究