車載導(dǎo)航人機語音交互系統(tǒng)的實現(xiàn)
發(fā)布時間:2008/5/28 0:00:00 訪問次數(shù):454
語音作為自然的人機接口,可以使車載導(dǎo)航系統(tǒng)實現(xiàn)更安全、更人性化的操作。通過國內(nèi)外車載導(dǎo)航系統(tǒng)的功能對比可知,支持語音交互是車載導(dǎo)航系統(tǒng)的一個發(fā)展趨勢。另外,市場信息服務(wù)公司j.d power and associates的調(diào)研數(shù)據(jù)也表明,56%的消費者更傾向于選擇聲控的導(dǎo)航系統(tǒng)。因此,開發(fā)車載語音導(dǎo)航系統(tǒng)是很有意義的。目前,國內(nèi)已經(jīng)具備開發(fā)車載語音導(dǎo)航系統(tǒng)的技術(shù)基礎(chǔ),特別是文語轉(zhuǎn)換tts技術(shù)和基于中小詞匯量的語音命令識別技術(shù)已經(jīng)達到比較實用的程度。本文在課題組的車載導(dǎo)航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上,開發(fā)了一套支持語音交互的車載導(dǎo)航系統(tǒng)。
車載語音導(dǎo)航系統(tǒng)結(jié)構(gòu)
車載語音導(dǎo)航系統(tǒng)從功能上分為車載導(dǎo)航和導(dǎo)航語音交互兩方面。其中車載導(dǎo)航功能包括gps衛(wèi)星導(dǎo)航定位、電子地圖瀏覽查詢、智能的路徑規(guī)劃、車輛地理位置和速度等導(dǎo)航信息的實時顯示;導(dǎo)航語音交互功能分為語音操作和語音提示兩部分。在系統(tǒng)的設(shè)計中,根據(jù)人機交互的需求,設(shè)計語音導(dǎo)航系統(tǒng)的硬件框架如圖1所示。
語音導(dǎo)航系統(tǒng)和用戶之間的人機交互接口由觸摸屏、按鈕、話筒、顯示屏和擴音器等五個交互設(shè)備組成。該硬件框架可實現(xiàn)常規(guī)的手動交互方式,也可以實現(xiàn)語音交互方式。整個系統(tǒng)劃分為三個子系統(tǒng):導(dǎo)航子系統(tǒng)、語音識別子系統(tǒng)和語音合成子系統(tǒng),各予系統(tǒng)間通過接口進行通信,協(xié)調(diào)完成語音導(dǎo)航任務(wù)。
車載導(dǎo)航人機語音交互系統(tǒng)對話模式設(shè)計
導(dǎo)航系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)
整個導(dǎo)航系統(tǒng)是一個復(fù)雜的人機交互系 統(tǒng),為便于語音交互對話模式的設(shè)計,首先對系統(tǒng)作狀態(tài)劃分,然后從人機交互的角度描述整個系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。將系統(tǒng)劃分為地圖瀏覽、功能選擇等六個功能狀態(tài)和一個退出狀態(tài)。圖2描述了這些狀態(tài)之間的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。
圖中的節(jié)點代表系統(tǒng)的各個狀態(tài),帶箭頭的連線代表從源狀態(tài)到目標狀態(tài)的轉(zhuǎn)換。狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)接收用戶的操作作為驅(qū)動事件,完成從一個狀態(tài)到另一狀念的轉(zhuǎn)換,網(wǎng)絡(luò)中的一條路徑便代表著特定的交互過程。
導(dǎo)航系統(tǒng)各狀態(tài)節(jié)點對話模式設(shè)計
為便于描述各狀態(tài)節(jié)點內(nèi)部的對話模式,將狀態(tài)節(jié)點按圖2所示編號為s1~s7,用tmn表示狀態(tài)節(jié)點sm到狀態(tài)節(jié)點sn的轉(zhuǎn)換。另外,借鑒狀態(tài)流stateflow模型的表示方法,提出用于描述車載導(dǎo)航人機語音交互系統(tǒng)中的對話模型。重新定義轉(zhuǎn)換的描述方式,用四個屬性來描述狀態(tài)節(jié)點內(nèi)的一次轉(zhuǎn)換:
t={p1,p2,p3,p4} (1)
其中,t用于表示一個轉(zhuǎn)換,p1~p4為轉(zhuǎn)換的屬性:p1為語音事件;p2為語音輸出;p3為附加條件;p4為轉(zhuǎn)換動作。
這樣,一個轉(zhuǎn)換t便描述了一次對話中用戶的語音輸入、系統(tǒng)的語音輸出、對話受到的限制條件以及系統(tǒng)執(zhí)行的動作。
以地圖瀏覽狀態(tài)為例,說明對話模式設(shè)計的過程。地圖瀏覽狀念由兩個瓦斥的子狀態(tài)組成:地圖漫游狀態(tài)和車輛引導(dǎo)狀態(tài)(參見圖2)。這兩種子狀態(tài)的人機交互大部分相同,所以將二者統(tǒng)一劃分在地圖瀏覽狀態(tài)下。對丁區(qū)分對待這兩個了狀態(tài)的交互過程,可以通過附加條件來判斷當前子狀態(tài),再作不同的處理。地圖瀏覽狀態(tài)節(jié)點的對話模式設(shè)計如圖3所示。
人機語音交互系統(tǒng)的實現(xiàn)
語音控制命令的實現(xiàn)
語音控制命令的實現(xiàn)方案如圖4所示。圖中左邊方框代表整個語音導(dǎo)航系統(tǒng)對話模式的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)stn。根據(jù)對話模式的設(shè)計,將系統(tǒng)分為地圖瀏覽狀態(tài)、功能選擇狀態(tài)、路徑規(guī)劃狀態(tài)等7個狀態(tài)節(jié)點,每個狀態(tài)節(jié)點內(nèi)部均存在各自的語音對話模式,對話模式由若干內(nèi)部轉(zhuǎn)換組成。因此,整個語音導(dǎo)航系統(tǒng)是一個兩層結(jié)構(gòu)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò),其內(nèi)部轉(zhuǎn)換由語音事件驅(qū)動。語音事件由導(dǎo)航子系統(tǒng)的接口模塊根據(jù)語音識別子系統(tǒng)發(fā)送的用戶意圖而產(chǎn)生。
語音摔制命令的實現(xiàn)過程分為以下四個步驟:
·語音識別引擎根據(jù)當前命令詞表識別用戶語音,得到識別結(jié)果。
·管理窗口獲取到識別結(jié)果,通過查詢“識別詞-控制命令”映射,得到識別結(jié)果對應(yīng)的控制命令,并將控制命令作為用戶意圖發(fā)送至導(dǎo)航子系統(tǒng)的接口模塊。
·接口模塊響應(yīng)用戶意圖,
語音作為自然的人機接口,可以使車載導(dǎo)航系統(tǒng)實現(xiàn)更安全、更人性化的操作。通過國內(nèi)外車載導(dǎo)航系統(tǒng)的功能對比可知,支持語音交互是車載導(dǎo)航系統(tǒng)的一個發(fā)展趨勢。另外,市場信息服務(wù)公司j.d power and associates的調(diào)研數(shù)據(jù)也表明,56%的消費者更傾向于選擇聲控的導(dǎo)航系統(tǒng)。因此,開發(fā)車載語音導(dǎo)航系統(tǒng)是很有意義的。目前,國內(nèi)已經(jīng)具備開發(fā)車載語音導(dǎo)航系統(tǒng)的技術(shù)基礎(chǔ),特別是文語轉(zhuǎn)換tts技術(shù)和基于中小詞匯量的語音命令識別技術(shù)已經(jīng)達到比較實用的程度。本文在課題組的車載導(dǎo)航系統(tǒng)和國內(nèi)兩款語音引擎的基礎(chǔ)上,開發(fā)了一套支持語音交互的車載導(dǎo)航系統(tǒng)。
車載語音導(dǎo)航系統(tǒng)結(jié)構(gòu)
車載語音導(dǎo)航系統(tǒng)從功能上分為車載導(dǎo)航和導(dǎo)航語音交互兩方面。其中車載導(dǎo)航功能包括gps衛(wèi)星導(dǎo)航定位、電子地圖瀏覽查詢、智能的路徑規(guī)劃、車輛地理位置和速度等導(dǎo)航信息的實時顯示;導(dǎo)航語音交互功能分為語音操作和語音提示兩部分。在系統(tǒng)的設(shè)計中,根據(jù)人機交互的需求,設(shè)計語音導(dǎo)航系統(tǒng)的硬件框架如圖1所示。
語音導(dǎo)航系統(tǒng)和用戶之間的人機交互接口由觸摸屏、按鈕、話筒、顯示屏和擴音器等五個交互設(shè)備組成。該硬件框架可實現(xiàn)常規(guī)的手動交互方式,也可以實現(xiàn)語音交互方式。整個系統(tǒng)劃分為三個子系統(tǒng):導(dǎo)航子系統(tǒng)、語音識別子系統(tǒng)和語音合成子系統(tǒng),各予系統(tǒng)間通過接口進行通信,協(xié)調(diào)完成語音導(dǎo)航任務(wù)。
車載導(dǎo)航人機語音交互系統(tǒng)對話模式設(shè)計
導(dǎo)航系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)
整個導(dǎo)航系統(tǒng)是一個復(fù)雜的人機交互系 統(tǒng),為便于語音交互對話模式的設(shè)計,首先對系統(tǒng)作狀態(tài)劃分,然后從人機交互的角度描述整個系統(tǒng)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。將系統(tǒng)劃分為地圖瀏覽、功能選擇等六個功能狀態(tài)和一個退出狀態(tài)。圖2描述了這些狀態(tài)之間的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)。
圖中的節(jié)點代表系統(tǒng)的各個狀態(tài),帶箭頭的連線代表從源狀態(tài)到目標狀態(tài)的轉(zhuǎn)換。狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)接收用戶的操作作為驅(qū)動事件,完成從一個狀態(tài)到另一狀念的轉(zhuǎn)換,網(wǎng)絡(luò)中的一條路徑便代表著特定的交互過程。
導(dǎo)航系統(tǒng)各狀態(tài)節(jié)點對話模式設(shè)計
為便于描述各狀態(tài)節(jié)點內(nèi)部的對話模式,將狀態(tài)節(jié)點按圖2所示編號為s1~s7,用tmn表示狀態(tài)節(jié)點sm到狀態(tài)節(jié)點sn的轉(zhuǎn)換。另外,借鑒狀態(tài)流stateflow模型的表示方法,提出用于描述車載導(dǎo)航人機語音交互系統(tǒng)中的對話模型。重新定義轉(zhuǎn)換的描述方式,用四個屬性來描述狀態(tài)節(jié)點內(nèi)的一次轉(zhuǎn)換:
t={p1,p2,p3,p4} (1)
其中,t用于表示一個轉(zhuǎn)換,p1~p4為轉(zhuǎn)換的屬性:p1為語音事件;p2為語音輸出;p3為附加條件;p4為轉(zhuǎn)換動作。
這樣,一個轉(zhuǎn)換t便描述了一次對話中用戶的語音輸入、系統(tǒng)的語音輸出、對話受到的限制條件以及系統(tǒng)執(zhí)行的動作。
以地圖瀏覽狀態(tài)為例,說明對話模式設(shè)計的過程。地圖瀏覽狀念由兩個瓦斥的子狀態(tài)組成:地圖漫游狀態(tài)和車輛引導(dǎo)狀態(tài)(參見圖2)。這兩種子狀態(tài)的人機交互大部分相同,所以將二者統(tǒng)一劃分在地圖瀏覽狀態(tài)下。對丁區(qū)分對待這兩個了狀態(tài)的交互過程,可以通過附加條件來判斷當前子狀態(tài),再作不同的處理。地圖瀏覽狀態(tài)節(jié)點的對話模式設(shè)計如圖3所示。
人機語音交互系統(tǒng)的實現(xiàn)
語音控制命令的實現(xiàn)
語音控制命令的實現(xiàn)方案如圖4所示。圖中左邊方框代表整個語音導(dǎo)航系統(tǒng)對話模式的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò)stn。根據(jù)對話模式的設(shè)計,將系統(tǒng)分為地圖瀏覽狀態(tài)、功能選擇狀態(tài)、路徑規(guī)劃狀態(tài)等7個狀態(tài)節(jié)點,每個狀態(tài)節(jié)點內(nèi)部均存在各自的語音對話模式,對話模式由若干內(nèi)部轉(zhuǎn)換組成。因此,整個語音導(dǎo)航系統(tǒng)是一個兩層結(jié)構(gòu)的狀態(tài)轉(zhuǎn)換網(wǎng)絡(luò),其內(nèi)部轉(zhuǎn)換由語音事件驅(qū)動。語音事件由導(dǎo)航子系統(tǒng)的接口模塊根據(jù)語音識別子系統(tǒng)發(fā)送的用戶意圖而產(chǎn)生。
語音摔制命令的實現(xiàn)過程分為以下四個步驟:
·語音識別引擎根據(jù)當前命令詞表識別用戶語音,得到識別結(jié)果。
·管理窗口獲取到識別結(jié)果,通過查詢“識別詞-控制命令”映射,得到識別結(jié)果對應(yīng)的控制命令,并將控制命令作為用戶意圖發(fā)送至導(dǎo)航子系統(tǒng)的接口模塊。
·接口模塊響應(yīng)用戶意圖,
上一篇:固定邏輯與可編程邏輯區(qū)別
熱門點擊
- 基于CD4060的硬件看門狗技術(shù)
- 基于RFID技術(shù)的智能倉庫管理系統(tǒng)
- 多路溫度采集及監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)
- 用ROM實現(xiàn)組合邏輯函數(shù)
- ESD知識
- 城市軌道交通電力綜合監(jiān)控系統(tǒng)的結(jié)構(gòu)與網(wǎng)絡(luò)通信
- TI新一代OMAP2處理器支持WMV9與H.
- Cadence推出高級時序簽收分析系統(tǒng)Enc
- 能量管理系統(tǒng)(EMS)在湖州電網(wǎng)中的應(yīng)用
- LwIP協(xié)議在μC/OS操作系統(tǒng)中的實現(xiàn)
推薦技術(shù)資料
- MOSFET 電感單片降壓開關(guān)模式變換器優(yōu)勢
- SiC MOSFET 和 IG
- 新型 電隔離無芯線性霍爾效應(yīng)電
- 業(yè)界超小絕對位置編碼器技術(shù)參數(shù)設(shè)計
- 高帶寬、更高分辨率磁角度傳感技術(shù)應(yīng)用探究
- MagAlpha 角度位置傳感
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究