高質(zhì)量語音處理技術(shù)的實(shí)現(xiàn)
發(fā)布時(shí)間:2008/5/27 0:00:00 訪問次數(shù):433
    
    
    家庭網(wǎng)絡(luò)已經(jīng)從個(gè)人計(jì)算機(jī)聯(lián)網(wǎng)逐漸演化成包括高級安全和自動(dòng)化應(yīng)用在內(nèi)的更為復(fù)雜的系統(tǒng)。家庭網(wǎng)絡(luò)一度曾是高端豪華住宅的專利,但現(xiàn)在已經(jīng)開始更多地應(yīng)用于普通家庭。這些網(wǎng)絡(luò)將暖氣、空調(diào)、燈光、家電、娛樂、內(nèi)部通信、電信、安全和監(jiān)控系統(tǒng)整合為一個(gè)易于操作的統(tǒng)一網(wǎng)絡(luò)。
    
    基于語音識別的交互式應(yīng)用(例如綜合門禁安全系統(tǒng)以及家電控制功能)是家庭自動(dòng)化網(wǎng)絡(luò)的主要特點(diǎn)。此類交互式功能依賴于高質(zhì)量的語音處理技術(shù),包括聲學(xué)回聲消除、低信號失真和噪聲抑制技術(shù)。一個(gè)設(shè)計(jì)良好的家庭自動(dòng)化系統(tǒng)還必須具備擴(kuò)展能力、為未來發(fā)展預(yù)留空間、能夠靈活地支持現(xiàn)場升級、支持交互式應(yīng)用、易于使用、成本經(jīng)濟(jì)并且非?煽。
    
    本文介紹了一些家庭自動(dòng)化系統(tǒng)面對的獨(dú)特的語音質(zhì)量性能問題和設(shè)計(jì)挑戰(zhàn)。文中將討論基于語音處理的家庭自動(dòng)化網(wǎng)絡(luò)應(yīng)用,研究有助于降低設(shè)計(jì)復(fù)雜性的一些關(guān)鍵特性和功能,并分析增強(qiáng)性能對成本的影響。
    
    家庭自動(dòng)化應(yīng)用中的語音處理
    
    家庭自動(dòng)化市場正在從高端豪華家庭進(jìn)入主流消費(fèi)群體。盡管目前這一市場仍然處于初期,研究人員依然估計(jì)其市場將超過10億美元。在亞洲、歐洲和北美洲,家庭自動(dòng)化市場正在以每年10%的平均速度迅速發(fā)展。僅歐洲市場,2009年對家庭自動(dòng)化系統(tǒng)的需求就會翻一翻,達(dá)到5億美元。隨著市場的發(fā)展,家庭自動(dòng)化系統(tǒng)本身也不斷演化,涉及藍(lán)牙、wi-fi、x10、zigbee和tcp/ip等多種技術(shù)。
    
    隨著市場和技術(shù)的不斷成熟,高質(zhì)量語音處理性能對家庭自動(dòng)化和安全應(yīng)用變得越來越重要。語音交互是統(tǒng)一家庭網(wǎng)絡(luò)的支撐性技術(shù),廣泛用于控制家電、通信、安全和娛樂設(shè)備。與其它交互方式相比,利用人類語音控制設(shè)備讓最終用戶感覺更舒服更自然。
    
    聲學(xué)回聲消除功能不夠好、環(huán)境噪聲和信號失真使家庭自動(dòng)化系統(tǒng)可靠工作變得越來越困難。如果語音處理性能達(dá)不到要求,語音識別功能就無法正確檢測到命令并相應(yīng)地開/關(guān)家電,而語音認(rèn)證功能也可能失靈,導(dǎo)致用戶無法方便地進(jìn)入自己的家。
    
    電話和內(nèi)部通信集成
    
    家庭自動(dòng)化系統(tǒng)越來越多地將電話通信和內(nèi)部通信功能集成起來。在有些系統(tǒng)設(shè)計(jì)中,內(nèi)部通信面板成為主要的通信工具,可用于住房訪問監(jiān)控和免提電話。因此,語音通信技術(shù)成為整個(gè)系統(tǒng)的重要方面。
    
    高質(zhì)量免提電話的一個(gè)重要特點(diǎn)就是全雙工操作和良好的雙方同時(shí)通話性能。全雙工系統(tǒng)支持雙向語音信號同時(shí)傳輸,因此交談更為自然。而半雙工系統(tǒng)在雙方同時(shí)講話時(shí),只允許功率水平高的一方信號通過,另一方信號被切斷。因此同一時(shí)間只能有一方的講話被對方聽到,并且通話是斷續(xù)的,不夠自然。
    
    在全雙工系統(tǒng)中,如果算法在雙方同時(shí)講話的情況下能夠連續(xù)會聚,就能夠獲得良好的聲學(xué)回聲消除性能。當(dāng)算法連續(xù)會聚時(shí),隨著信號源的移動(dòng),算法會跟蹤回聲路徑中的變化。如果算法在雙方同時(shí)講話時(shí)停止會聚,當(dāng)雙方同時(shí)講話停止時(shí)又恢復(fù)會聚,那么在算法重新適應(yīng)新的回聲環(huán)境時(shí)用戶會聽到猝發(fā)回聲。
    
    對于數(shù)字免提電話來說,獲得高質(zhì)量通話的另一個(gè)方面是編碼/***(codec)的選擇。正是編碼***完成信號從數(shù)字到模擬的變換,以及反向變換。傳統(tǒng)的中等質(zhì)量數(shù)字電話采用窄帶編碼***和8khz的采樣頻率。寬帶編碼***采樣頻率加倍(16khz),能夠采集更多人聲分量,從而支持更高的話音質(zhì)量。
    
    設(shè)計(jì)高性能系統(tǒng)
    
    1. 克服塑料外殼帶來的物理限制
    
    小型內(nèi)部通信面板由于不占用額外空間,因此越來越多地在家庭設(shè)計(jì)中得到應(yīng)用。但受限的面板尺寸會對塑料外殼的設(shè)計(jì)、麥克風(fēng)和揚(yáng)聲器的選擇、布局和隔離作出很多限制。
    
    在理想系統(tǒng)中,揚(yáng)聲器和麥克風(fēng)間的隔離應(yīng)當(dāng)盡可能好,才能達(dá)到最優(yōu)的性能。但在小型塑料外殼中,兩者之間隔離較差帶來額外的聲學(xué)耦合,也意味著更大的回聲。
    
    
    
    家庭網(wǎng)絡(luò)已經(jīng)從個(gè)人計(jì)算機(jī)聯(lián)網(wǎng)逐漸演化成包括高級安全和自動(dòng)化應(yīng)用在內(nèi)的更為復(fù)雜的系統(tǒng)。家庭網(wǎng)絡(luò)一度曾是高端豪華住宅的專利,但現(xiàn)在已經(jīng)開始更多地應(yīng)用于普通家庭。這些網(wǎng)絡(luò)將暖氣、空調(diào)、燈光、家電、娛樂、內(nèi)部通信、電信、安全和監(jiān)控系統(tǒng)整合為一個(gè)易于操作的統(tǒng)一網(wǎng)絡(luò)。
    
    基于語音識別的交互式應(yīng)用(例如綜合門禁安全系統(tǒng)以及家電控制功能)是家庭自動(dòng)化網(wǎng)絡(luò)的主要特點(diǎn)。此類交互式功能依賴于高質(zhì)量的語音處理技術(shù),包括聲學(xué)回聲消除、低信號失真和噪聲抑制技術(shù)。一個(gè)設(shè)計(jì)良好的家庭自動(dòng)化系統(tǒng)還必須具備擴(kuò)展能力、為未來發(fā)展預(yù)留空間、能夠靈活地支持現(xiàn)場升級、支持交互式應(yīng)用、易于使用、成本經(jīng)濟(jì)并且非?煽。
    
    本文介紹了一些家庭自動(dòng)化系統(tǒng)面對的獨(dú)特的語音質(zhì)量性能問題和設(shè)計(jì)挑戰(zhàn)。文中將討論基于語音處理的家庭自動(dòng)化網(wǎng)絡(luò)應(yīng)用,研究有助于降低設(shè)計(jì)復(fù)雜性的一些關(guān)鍵特性和功能,并分析增強(qiáng)性能對成本的影響。
    
    家庭自動(dòng)化應(yīng)用中的語音處理
    
    家庭自動(dòng)化市場正在從高端豪華家庭進(jìn)入主流消費(fèi)群體。盡管目前這一市場仍然處于初期,研究人員依然估計(jì)其市場將超過10億美元。在亞洲、歐洲和北美洲,家庭自動(dòng)化市場正在以每年10%的平均速度迅速發(fā)展。僅歐洲市場,2009年對家庭自動(dòng)化系統(tǒng)的需求就會翻一翻,達(dá)到5億美元。隨著市場的發(fā)展,家庭自動(dòng)化系統(tǒng)本身也不斷演化,涉及藍(lán)牙、wi-fi、x10、zigbee和tcp/ip等多種技術(shù)。
    
    隨著市場和技術(shù)的不斷成熟,高質(zhì)量語音處理性能對家庭自動(dòng)化和安全應(yīng)用變得越來越重要。語音交互是統(tǒng)一家庭網(wǎng)絡(luò)的支撐性技術(shù),廣泛用于控制家電、通信、安全和娛樂設(shè)備。與其它交互方式相比,利用人類語音控制設(shè)備讓最終用戶感覺更舒服更自然。
    
    聲學(xué)回聲消除功能不夠好、環(huán)境噪聲和信號失真使家庭自動(dòng)化系統(tǒng)可靠工作變得越來越困難。如果語音處理性能達(dá)不到要求,語音識別功能就無法正確檢測到命令并相應(yīng)地開/關(guān)家電,而語音認(rèn)證功能也可能失靈,導(dǎo)致用戶無法方便地進(jìn)入自己的家。
    
    電話和內(nèi)部通信集成
    
    家庭自動(dòng)化系統(tǒng)越來越多地將電話通信和內(nèi)部通信功能集成起來。在有些系統(tǒng)設(shè)計(jì)中,內(nèi)部通信面板成為主要的通信工具,可用于住房訪問監(jiān)控和免提電話。因此,語音通信技術(shù)成為整個(gè)系統(tǒng)的重要方面。
    
    高質(zhì)量免提電話的一個(gè)重要特點(diǎn)就是全雙工操作和良好的雙方同時(shí)通話性能。全雙工系統(tǒng)支持雙向語音信號同時(shí)傳輸,因此交談更為自然。而半雙工系統(tǒng)在雙方同時(shí)講話時(shí),只允許功率水平高的一方信號通過,另一方信號被切斷。因此同一時(shí)間只能有一方的講話被對方聽到,并且通話是斷續(xù)的,不夠自然。
    
    在全雙工系統(tǒng)中,如果算法在雙方同時(shí)講話的情況下能夠連續(xù)會聚,就能夠獲得良好的聲學(xué)回聲消除性能。當(dāng)算法連續(xù)會聚時(shí),隨著信號源的移動(dòng),算法會跟蹤回聲路徑中的變化。如果算法在雙方同時(shí)講話時(shí)停止會聚,當(dāng)雙方同時(shí)講話停止時(shí)又恢復(fù)會聚,那么在算法重新適應(yīng)新的回聲環(huán)境時(shí)用戶會聽到猝發(fā)回聲。
    
    對于數(shù)字免提電話來說,獲得高質(zhì)量通話的另一個(gè)方面是編碼/***(codec)的選擇。正是編碼***完成信號從數(shù)字到模擬的變換,以及反向變換。傳統(tǒng)的中等質(zhì)量數(shù)字電話采用窄帶編碼***和8khz的采樣頻率。寬帶編碼***采樣頻率加倍(16khz),能夠采集更多人聲分量,從而支持更高的話音質(zhì)量。
    
    設(shè)計(jì)高性能系統(tǒng)
    
    1. 克服塑料外殼帶來的物理限制
    
    小型內(nèi)部通信面板由于不占用額外空間,因此越來越多地在家庭設(shè)計(jì)中得到應(yīng)用。但受限的面板尺寸會對塑料外殼的設(shè)計(jì)、麥克風(fēng)和揚(yáng)聲器的選擇、布局和隔離作出很多限制。
    
    在理想系統(tǒng)中,揚(yáng)聲器和麥克風(fēng)間的隔離應(yīng)當(dāng)盡可能好,才能達(dá)到最優(yōu)的性能。但在小型塑料外殼中,兩者之間隔離較差帶來額外的聲學(xué)耦合,也意味著更大的回聲。
    
熱門點(diǎn)擊
- 用代理服務(wù)器及瀏覽器隱藏IP地址的方法
- U/V段業(yè)余中繼通訊初探
- 一卡通郵政綜合服務(wù)系統(tǒng)
- 基于Modbus協(xié)議實(shí)現(xiàn)單片機(jī)與PLC之間的
- SJA1000在CAN總線系統(tǒng)節(jié)點(diǎn)的應(yīng)用
- 利用調(diào)頻立體聲基帶傳送數(shù)據(jù)信息的原理及實(shí)現(xiàn)
- RS-232串行通信消除干擾噪聲的設(shè)計(jì)方法分
- COFDM傳輸系統(tǒng)中符號定時(shí)同步的算法研究
- RS422/RS485網(wǎng)絡(luò)的無極性接線設(shè)計(jì)
- 智能天線為無線局域網(wǎng)添加精彩
推薦技術(shù)資料
- AMOLED顯示驅(qū)動(dòng)芯片關(guān)鍵技
- CMOS圖像傳感器技術(shù)參數(shù)設(shè)計(jì)
- GB300 超級芯片應(yīng)用需求分
- 4NP 工藝NVIDIA Bl
- GB300 芯片、NVL72
- 首個(gè)最新高端芯片人工智能服務(wù)器
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究