嵌入式語音識別引擎及語音識別片上系統(tǒng)
發(fā)布時間:2007/8/20 0:00:00 訪問次數(shù):709
北京華錄潤聲微電子技術(shù)有限公司
清華大學(xué)電子工程系語音技術(shù)與芯片設(shè)計實驗室
北京華錄潤聲微電子技術(shù)有限公司是由國內(nèi)電子百強企業(yè)之一—中國華錄集團(tuán)以及國內(nèi)第一家專業(yè)創(chuàng)業(yè)投資公司深圳市中科招商創(chuàng)業(yè)投資有限公司共同投資興建的,注冊資本1700萬,專業(yè)從事語音技術(shù)領(lǐng)域的產(chǎn)品研發(fā)、銷售及技術(shù)服務(wù)的高科技公司。公司主要技術(shù)骨干均由清華大學(xué)畢業(yè)的博士與碩士組成。公司和清華大學(xué)簽署有技術(shù)轉(zhuǎn)讓協(xié)議,所以技術(shù)依托清華大學(xué)電子工程系語音技術(shù)與芯片設(shè)計實驗室,該實驗室專門從事嵌入式語音識別技術(shù)的研究達(dá)十幾年。最新研發(fā)出的基于子詞的非特定人嵌入式語音識別引擎和片上系統(tǒng),是目前對硬件資源需要最小的高性能漢語識別引擎和片上系統(tǒng)。該引擎采用大詞匯量連續(xù)語音識別技術(shù),并且作大量的參數(shù)優(yōu)化、模型優(yōu)化、運算方法優(yōu)化等工作。因此有效地壓縮了模參數(shù)的規(guī)模,且具有很高的識別性能,達(dá)到國際先進(jìn)水平,是國家863計劃成果,并完全可以實用化。歡迎工業(yè)界的朋友們和我們聯(lián)系,我們將竭誠為社會各界提供完善的產(chǎn)品和技術(shù)服務(wù),并與各界朋友共創(chuàng)輝煌。
一、語音識別引擎
(1) 主要性能指標(biāo):
·識別詞條容量大:可識別1000多條連續(xù)語音命令
·識別正確率高:對4000樣本經(jīng)過嚴(yán)格測試,其識別正確率如下
·識別速度快: 在100Mips的16bit定點DSP上,對600個詞條進(jìn)行語音識別時,每條語音的識別時間小于0.2倍實時。即識別一般人名或其它名稱時,所需的識別時間只有0.2秒的時間,使人感覺不到滯后。
·具有高性能孤立數(shù)碼語音識別,識別率高達(dá)98%以上。而且數(shù)碼可以與人名等詞條混合識別。
·對硬件資源需求。
要求程序存貯量 16KB(ROM或SRAM)
數(shù)據(jù)存貯量32KB~48KB(SRAM)
(2)應(yīng)用特點:本語音識別引擎非常適用于高檔手機(jī)中,它完全不同于現(xiàn)有手機(jī)中的語音撥號功能。其應(yīng)用特點如下:
·無需用戶進(jìn)行繁鎖的語音采集和訓(xùn)練。由于采用子詞的拼接方式組成識別詞表中各詞條的模板,對新增加的語音命令和人名,用戶無需進(jìn)行語音訓(xùn)練,可以直接通過文本方式輸入(如手寫或拼音輸入)所需要識別的命令或人名,也可以通過與計算機(jī)接口由計算機(jī)載入,系統(tǒng)可以直接生成識別模板,就可以用語音進(jìn)行人名檢索撥號或者用語音命令控制各種操作。
·在手機(jī)上,適于實現(xiàn)電話本的語音檢索和撥號,可以存1000個人名或單位名。還可以用語音數(shù)碼撥號?梢愿郊诱Z音信息,成為語音名片簿。
·在手機(jī)上,無需用戶訓(xùn)練,可以實現(xiàn)語音命令操作替代或減少用戶的按鍵操作。方便用戶行進(jìn)中或汽車中應(yīng)用的方便。
·基本上無需增加硬件資源,就可以將本語音識別引擎嵌入到手機(jī)中。由于本引擎所需的硬件資源小,現(xiàn)有的手機(jī)一般皆可滿足。因而只要增加很少的程序ROM就實現(xiàn)很高性能的語音識別功能。
(3)便于移植
·本語音識別引擎經(jīng)過多次改進(jìn),嚴(yán)格的測試,結(jié)構(gòu)的模塊化,現(xiàn)已經(jīng)開發(fā)成一套完整的、標(biāo)準(zhǔn)的定點C程序。較容易地移植到16bit,32bit各種MCU或DSP平臺上。
·已優(yōu)化移植在DSPG公司的OAK及ADI公司的ADSP218X系列DSP上。取得了在不同平臺上移植優(yōu)化的經(jīng)驗。
我們愿意與貴公司合作。在貴公司生產(chǎn)的手機(jī)上嵌入本實驗室研發(fā)的語音識別引擎。使貴公司生產(chǎn)手機(jī)產(chǎn)品升級。
二、語音識別片上系統(tǒng)THSR-2
該實驗室還研發(fā)了一個高性能語音識別專用芯片(片上系統(tǒng)SoC)。應(yīng)用此芯片,只要加入很少的外圍元件就可以組成一個高性能的語音識別及語音壓縮編解碼系統(tǒng)。此芯片還有集成度高、功耗低和成本低的特點。
(1)先進(jìn)的雙核嵌入式芯片結(jié)構(gòu)見圖1
(2)片內(nèi)包含:
·高性能DSP:高速16bit定點DSP,100MIPS
·高速MCU:與8051兼容
·大容量內(nèi)存SRAM:124Kbyte
 
北京華錄潤聲微電子技術(shù)有限公司
清華大學(xué)電子工程系語音技術(shù)與芯片設(shè)計實驗室
北京華錄潤聲微電子技術(shù)有限公司是由國內(nèi)電子百強企業(yè)之一—中國華錄集團(tuán)以及國內(nèi)第一家專業(yè)創(chuàng)業(yè)投資公司深圳市中科招商創(chuàng)業(yè)投資有限公司共同投資興建的,注冊資本1700萬,專業(yè)從事語音技術(shù)領(lǐng)域的產(chǎn)品研發(fā)、銷售及技術(shù)服務(wù)的高科技公司。公司主要技術(shù)骨干均由清華大學(xué)畢業(yè)的博士與碩士組成。公司和清華大學(xué)簽署有技術(shù)轉(zhuǎn)讓協(xié)議,所以技術(shù)依托清華大學(xué)電子工程系語音技術(shù)與芯片設(shè)計實驗室,該實驗室專門從事嵌入式語音識別技術(shù)的研究達(dá)十幾年。最新研發(fā)出的基于子詞的非特定人嵌入式語音識別引擎和片上系統(tǒng),是目前對硬件資源需要最小的高性能漢語識別引擎和片上系統(tǒng)。該引擎采用大詞匯量連續(xù)語音識別技術(shù),并且作大量的參數(shù)優(yōu)化、模型優(yōu)化、運算方法優(yōu)化等工作。因此有效地壓縮了模參數(shù)的規(guī)模,且具有很高的識別性能,達(dá)到國際先進(jìn)水平,是國家863計劃成果,并完全可以實用化。歡迎工業(yè)界的朋友們和我們聯(lián)系,我們將竭誠為社會各界提供完善的產(chǎn)品和技術(shù)服務(wù),并與各界朋友共創(chuàng)輝煌。
一、語音識別引擎
(1) 主要性能指標(biāo):
·識別詞條容量大:可識別1000多條連續(xù)語音命令
·識別正確率高:對4000樣本經(jīng)過嚴(yán)格測試,其識別正確率如下
·識別速度快: 在100Mips的16bit定點DSP上,對600個詞條進(jìn)行語音識別時,每條語音的識別時間小于0.2倍實時。即識別一般人名或其它名稱時,所需的識別時間只有0.2秒的時間,使人感覺不到滯后。
·具有高性能孤立數(shù)碼語音識別,識別率高達(dá)98%以上。而且數(shù)碼可以與人名等詞條混合識別。
·對硬件資源需求小:
要求程序存貯量 16KB(ROM或SRAM)
數(shù)據(jù)存貯量32KB~48KB(SRAM)
(2)應(yīng)用特點:本語音識別引擎非常適用于高檔手機(jī)中,它完全不同于現(xiàn)有手機(jī)中的語音撥號功能。其應(yīng)用特點如下:
·無需用戶進(jìn)行繁鎖的語音采集和訓(xùn)練。由于采用子詞的拼接方式組成識別詞表中各詞條的模板,對新增加的語音命令和人名,用戶無需進(jìn)行語音訓(xùn)練,可以直接通過文本方式輸入(如手寫或拼音輸入)所需要識別的命令或人名,也可以通過與計算機(jī)接口由計算機(jī)載入,系統(tǒng)可以直接生成識別模板,就可以用語音進(jìn)行人名檢索撥號或者用語音命令控制各種操作。
·在手機(jī)上,適于實現(xiàn)電話本的語音檢索和撥號,可以存1000個人名或單位名。還可以用語音數(shù)碼撥號。可以附加語音信息,成為語音名片簿。
·在手機(jī)上,無需用戶訓(xùn)練,可以實現(xiàn)語音命令操作替代或減少用戶的按鍵操作。方便用戶行進(jìn)中或汽車中應(yīng)用的方便。
·基本上無需增加硬件資源,就可以將本語音識別引擎嵌入到手機(jī)中。由于本引擎所需的硬件資源小,現(xiàn)有的手機(jī)一般皆可滿足。因而只要增加很少的程序ROM就實現(xiàn)很高性能的語音識別功能。
(3)便于移植
·本語音識別引擎經(jīng)過多次改進(jìn),嚴(yán)格的測試,結(jié)構(gòu)的模塊化,現(xiàn)已經(jīng)開發(fā)成一套完整的、標(biāo)準(zhǔn)的定點C程序。較容易地移植到16bit,32bit各種MCU或DSP平臺上。
·已優(yōu)化移植在DSPG公司的OAK及ADI公司的ADSP218X系列DSP上。取得了在不同平臺上移植優(yōu)化的經(jīng)驗。
我們愿意與貴公司合作。在貴公司生產(chǎn)的手機(jī)上嵌入本實驗室研發(fā)的語音識別引擎。使貴公司生產(chǎn)手機(jī)產(chǎn)品升級。
二、語音識別片上系統(tǒng)THSR-2
該實驗室還研發(fā)了一個高性能語音識別專用芯片(片上系統(tǒng)SoC)。應(yīng)用此芯片,只要加入很少的外圍元件就可以組成一個高性能的語音識別及語音壓縮編解碼系統(tǒng)。此芯片還有集成度高、功耗低和成本低的特點。
(1)先進(jìn)的雙核嵌入式芯片結(jié)構(gòu)見圖1
(2)片內(nèi)包含:
·高性能DSP:高速16bit定點DSP,100MIPS
·高速MCU:與8051兼容
·大容量內(nèi)存SRAM:124Kbyte
 
熱門點擊
- MMIC和RFIC的CAD 王紹東,高學(xué)邦,
- 壓電晶體
- LabVIEW與MATLAB混合編程
- 3G W-CDMA FDD直接轉(zhuǎn)換零中頻接收
- EDA海外發(fā)展前景(上)
- 數(shù)字動態(tài)偏置IC提供完整的功率放大器偏置解決
- 采用微流體背部冷卻技術(shù)實現(xiàn)芯片散熱(圖)
- 以太網(wǎng):技術(shù)和應(yīng)用不斷擴(kuò)展 信息產(chǎn)業(yè)部電信研
- 基于單片機(jī)的智能防腐電源的設(shè)計和實現(xiàn) 武漢理
- 一種MCU時鐘系統(tǒng)的設(shè)計 上海大學(xué)微電子研究
推薦技術(shù)資料
- AMOLED顯示驅(qū)動芯片關(guān)鍵技
- CMOS圖像傳感器技術(shù)參數(shù)設(shè)計
- GB300 超級芯片應(yīng)用需求分
- 4NP 工藝NVIDIA Bl
- GB300 芯片、NVL72
- 首個最新高端芯片人工智能服務(wù)器
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究