DSP的聲控電子記事本的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2008/8/30 0:00:00 訪問(wèn)次數(shù):523
語(yǔ)音輸入方式與手寫(xiě)輸入方式相比,具有操作簡(jiǎn)便、查找方便、識(shí)別準(zhǔn)確率高等優(yōu)點(diǎn)。省去了大量的輸入時(shí)間,降低了信息檢索的復(fù)雜度。本文所介紹的聲控電子記事本系統(tǒng)將語(yǔ)音識(shí)別和語(yǔ)音編解碼在同一片dsp芯片上實(shí)現(xiàn),用語(yǔ)音方式代替其它方式進(jìn)行信息輸入,提高了系統(tǒng)的靈活性。
。薄∠到y(tǒng)功能
可存200張語(yǔ)音名片,每張語(yǔ)音名片包含四條信息:姓名、電話號(hào)碼、工作單位、備注;聲控查找語(yǔ)音名片信息,用戶只需口述所要查找人的姓名,即可獲得電話號(hào)碼、工作單位、備注等信息,同時(shí)電話號(hào)碼顯示在液晶顯示屏上。
具有雙音多頻(dtmf)撥號(hào)功能,用戶用聲控查找到電話號(hào)碼并顯示在液晶屏上之后,只需輕觸一個(gè)撥號(hào)鍵,即可通過(guò)普通電話機(jī)的話筒實(shí)現(xiàn)快速自動(dòng)撥號(hào)。
數(shù)字錄音,每段錄音加語(yǔ)音標(biāo)識(shí);聲控放音,在放音時(shí)只需口述所要語(yǔ)音段的語(yǔ)音標(biāo)識(shí)即可自動(dòng)找到該段錄音并加放,累計(jì)錄音時(shí)間達(dá)兩個(gè)半小時(shí)以上。
具有方便的編輯功能,增加、刪除語(yǔ)音名片,增加、刪除數(shù)字錄音段。
2 系統(tǒng)構(gòu)成
本文所介紹的聲控電子記事本系統(tǒng),是在定點(diǎn)16位dsp芯片上實(shí)現(xiàn)的,它包含特定人孤立詞語(yǔ)音識(shí)別算法和代數(shù)碼本激勵(lì)線性預(yù)測(cè)(acelp)語(yǔ)音編解碼算法數(shù)(mfcc)為語(yǔ)音特征、以動(dòng)態(tài)時(shí)間規(guī)劃(dtw)為模板匹配算法,對(duì)于普通詞條,識(shí)別率達(dá)到了99%以上。用于“錄音”功能的acelp算法是該碼率下性能優(yōu)異的編解碼算法,雖然算法復(fù)雜度較高,但共重建語(yǔ)音質(zhì)量的平均主觀評(píng)測(cè)分?jǐn)?shù)(mos分)達(dá)到了4.0,非常接近于壓縮前的分?jǐn)?shù)4.3。
如圖1所示,系統(tǒng)由mcu實(shí)現(xiàn)總線控制,接受外部鍵盤(pán)輸入,并在液晶屏上顯示信息。在本系統(tǒng)中,語(yǔ)音充當(dāng)大部分人機(jī)界面的角色,盡量省去復(fù)雜的鍵盤(pán)操作,而且用語(yǔ)音提示或語(yǔ)音回放代替一部門(mén)液晶文字提示。由于語(yǔ)音要經(jīng)過(guò)dsp處理,所以mcu需要與dsp經(jīng)常交換信息,以便實(shí)現(xiàn)友好的操作界面。
。玻薄。洌螅
dsp(adsp2185)是整個(gè)硬件系統(tǒng)的信號(hào)處理中心,完成語(yǔ)音識(shí)別、訓(xùn)練、編解碼,進(jìn)行片內(nèi)ram及外部flash存儲(chǔ)芯片的數(shù)據(jù)管理與調(diào)度,并向主控芯片mcu提供簡(jiǎn)潔的命令與反饋信息。adsp2185是analog devices公司的產(chǎn)品,其主要性能如下:
運(yùn)算速度為50mips,且均為高效的單周期指令。
提供了80kbyte的片內(nèi)ram,其中32kbyte為數(shù)據(jù)ram,48kbyte為程序ram。
最大可支持4mbyte的外部存儲(chǔ)區(qū),用于存儲(chǔ)數(shù)據(jù)或程序。
提供對(duì)字節(jié)存儲(chǔ)區(qū)(bm)與片內(nèi)ram區(qū)之間的dma方式支持。
提供兩上可編程、全雙工、自動(dòng)進(jìn)行收發(fā)緩沖區(qū)操作的串行口。
。玻病。恚悖
。恚悖酰ǎ耄螅担罚悖玻常保叮┦牵螅幔恚螅酰睿绻旧a(chǎn)的性價(jià)比較高的一種cmos四位單片機(jī),可以一次性編程,適于小批量生產(chǎn),被廣泛地應(yīng)用于家用電器的控制,它具有強(qiáng)大的i/o功能。其主要性能如下:
。颍铮頌椋保叮搿粒浮。猓椋;ram為512×4 bit
。矗皞(gè)i/o引腳
多至16位數(shù)字lcd顯示
32個(gè)段,4個(gè)公共端引腳
這些性能保證了系統(tǒng)主控能力,而且能夠提供靈活的外部接口,適于做進(jìn)一步的改進(jìn)和改造。計(jì)算器等附加功能可以直接由mcu完成。
。玻场(shù)據(jù)flash存儲(chǔ)器
數(shù)據(jù)flash存儲(chǔ)器km29u64000是samsung公司的產(chǎn)品,它可在3伏電壓下低功耗工作,存貯量大、價(jià)位低、速度快、存儲(chǔ)數(shù)據(jù)掉電后可保持而不會(huì)丟失。其主要性能指標(biāo)如下:
存儲(chǔ)單元陣列為(8m+256k)×8bit;數(shù)據(jù)寄存器(512+16)×8bit
頁(yè)寫(xiě)入為(512+16)byte;塊擦除為(8k+256)byte
命令/地址/數(shù)據(jù)復(fù)用i/o端口
可靠的cmos。妫欤铮幔簦椋睿纾纾幔簦寮夹g(shù),耐受一百萬(wàn)次寫(xiě)入/擦除,數(shù)據(jù)維持時(shí)間為10年
命令寄存器操作
2.4 其它器件
本系統(tǒng)還采用了analog。洌澹觯椋悖澹蠊镜模悖铮洌澹悖ǎ幔、d/a變換器)ad73311l,sst的flash存儲(chǔ)器sst29le010(128k×8bit)存儲(chǔ)dsp程序及運(yùn)算數(shù)據(jù)。
3 系統(tǒng)內(nèi)主要芯片的互連互控
。常薄。恚悖跖cdsp
。恚悖跖cdsp采用串
語(yǔ)音輸入方式與手寫(xiě)輸入方式相比,具有操作簡(jiǎn)便、查找方便、識(shí)別準(zhǔn)確率高等優(yōu)點(diǎn)。省去了大量的輸入時(shí)間,降低了信息檢索的復(fù)雜度。本文所介紹的聲控電子記事本系統(tǒng)將語(yǔ)音識(shí)別和語(yǔ)音編解碼在同一片dsp芯片上實(shí)現(xiàn),用語(yǔ)音方式代替其它方式進(jìn)行信息輸入,提高了系統(tǒng)的靈活性。
1 系統(tǒng)功能
可存200張語(yǔ)音名片,每張語(yǔ)音名片包含四條信息:姓名、電話號(hào)碼、工作單位、備注;聲控查找語(yǔ)音名片信息,用戶只需口述所要查找人的姓名,即可獲得電話號(hào)碼、工作單位、備注等信息,同時(shí)電話號(hào)碼顯示在液晶顯示屏上。
具有雙音多頻(dtmf)撥號(hào)功能,用戶用聲控查找到電話號(hào)碼并顯示在液晶屏上之后,只需輕觸一個(gè)撥號(hào)鍵,即可通過(guò)普通電話機(jī)的話筒實(shí)現(xiàn)快速自動(dòng)撥號(hào)。
數(shù)字錄音,每段錄音加語(yǔ)音標(biāo)識(shí);聲控放音,在放音時(shí)只需口述所要語(yǔ)音段的語(yǔ)音標(biāo)識(shí)即可自動(dòng)找到該段錄音并加放,累計(jì)錄音時(shí)間達(dá)兩個(gè)半小時(shí)以上。
具有方便的編輯功能,增加、刪除語(yǔ)音名片,增加、刪除數(shù)字錄音段。
。病∠到y(tǒng)構(gòu)成
本文所介紹的聲控電子記事本系統(tǒng),是在定點(diǎn)16位dsp芯片上實(shí)現(xiàn)的,它包含特定人孤立詞語(yǔ)音識(shí)別算法和代數(shù)碼本激勵(lì)線性預(yù)測(cè)(acelp)語(yǔ)音編解碼算法數(shù)(mfcc)為語(yǔ)音特征、以動(dòng)態(tài)時(shí)間規(guī)劃(dtw)為模板匹配算法,對(duì)于普通詞條,識(shí)別率達(dá)到了99%以上。用于“錄音”功能的acelp算法是該碼率下性能優(yōu)異的編解碼算法,雖然算法復(fù)雜度較高,但共重建語(yǔ)音質(zhì)量的平均主觀評(píng)測(cè)分?jǐn)?shù)(mos分)達(dá)到了4.0,非常接近于壓縮前的分?jǐn)?shù)4.3。
如圖1所示,系統(tǒng)由mcu實(shí)現(xiàn)總線控制,接受外部鍵盤(pán)輸入,并在液晶屏上顯示信息。在本系統(tǒng)中,語(yǔ)音充當(dāng)大部分人機(jī)界面的角色,盡量省去復(fù)雜的鍵盤(pán)操作,而且用語(yǔ)音提示或語(yǔ)音回放代替一部門(mén)液晶文字提示。由于語(yǔ)音要經(jīng)過(guò)dsp處理,所以mcu需要與dsp經(jīng)常交換信息,以便實(shí)現(xiàn)友好的操作界面。
。玻薄。洌螅
dsp(adsp2185)是整個(gè)硬件系統(tǒng)的信號(hào)處理中心,完成語(yǔ)音識(shí)別、訓(xùn)練、編解碼,進(jìn)行片內(nèi)ram及外部flash存儲(chǔ)芯片的數(shù)據(jù)管理與調(diào)度,并向主控芯片mcu提供簡(jiǎn)潔的命令與反饋信息。adsp2185是analog。洌澹觯椋悖澹蠊镜漠a(chǎn)品,其主要性能如下:
運(yùn)算速度為50mips,且均為高效的單周期指令。
提供了80kbyte的片內(nèi)ram,其中32kbyte為數(shù)據(jù)ram,48kbyte為程序ram。
最大可支持4mbyte的外部存儲(chǔ)區(qū),用于存儲(chǔ)數(shù)據(jù)或程序。
提供對(duì)字節(jié)存儲(chǔ)區(qū)(bm)與片內(nèi)ram區(qū)之間的dma方式支持。
提供兩上可編程、全雙工、自動(dòng)進(jìn)行收發(fā)緩沖區(qū)操作的串行口。
。玻病。恚悖
。恚悖酰ǎ耄螅担罚悖玻常保叮┦牵螅幔恚螅酰睿绻旧a(chǎn)的性價(jià)比較高的一種cmos四位單片機(jī),可以一次性編程,適于小批量生產(chǎn),被廣泛地應(yīng)用于家用電器的控制,它具有強(qiáng)大的i/o功能。其主要性能如下:
。颍铮頌椋保叮搿粒浮。猓椋簦唬颍幔頌椋担保病粒础。猓椋
。矗皞(gè)i/o引腳
多至16位數(shù)字lcd顯示
。常矀(gè)段,4個(gè)公共端引腳
這些性能保證了系統(tǒng)主控能力,而且能夠提供靈活的外部接口,適于做進(jìn)一步的改進(jìn)和改造。計(jì)算器等附加功能可以直接由mcu完成。
。玻场(shù)據(jù)flash存儲(chǔ)器
數(shù)據(jù)flash存儲(chǔ)器km29u64000是samsung公司的產(chǎn)品,它可在3伏電壓下低功耗工作,存貯量大、價(jià)位低、速度快、存儲(chǔ)數(shù)據(jù)掉電后可保持而不會(huì)丟失。其主要性能指標(biāo)如下:
存儲(chǔ)單元陣列為(8m+256k)×8bit;數(shù)據(jù)寄存器(512+16)×8bit
頁(yè)寫(xiě)入為(512+16)byte;塊擦除為(8k+256)byte
命令/地址/數(shù)據(jù)復(fù)用i/o端口
可靠的cmos。妫欤铮幔簦椋睿纾纾幔簦寮夹g(shù),耐受一百萬(wàn)次寫(xiě)入/擦除,數(shù)據(jù)維持時(shí)間為10年
命令寄存器操作
。玻础∑渌骷
本系統(tǒng)還采用了analog。洌澹觯椋悖澹蠊镜模悖铮洌澹悖ǎ幔洹ⅲ洌嶙儞Q器)ad73311l,sst的flash存儲(chǔ)器sst29le010(128k×8bit)存儲(chǔ)dsp程序及運(yùn)算數(shù)據(jù)。
3 系統(tǒng)內(nèi)主要芯片的互連互控
。常薄。恚悖跖cdsp
mcu與dsp采用串
熱門(mén)點(diǎn)擊
- DSP在電力系統(tǒng)同步交流采樣中的應(yīng)用
- dsp編程優(yōu)化方法
- ADS下C語(yǔ)言中局部變量的存儲(chǔ)位置分配
- 使用C/C++語(yǔ)言編寫(xiě)基于DSP程序的注意事
- 基于DSP的視頻采集驅(qū)動(dòng)程序的實(shí)現(xiàn)
- DSP的串行通信在變頻調(diào)速系統(tǒng)中的應(yīng)用
- 嵌入式CAN總線控制器與DSP的接口
- DSP的網(wǎng)絡(luò)通信程序設(shè)計(jì)
- DSP的聲控電子記事本的設(shè)計(jì)與實(shí)現(xiàn)
- DSP在自動(dòng)目標(biāo)識(shí)別中的應(yīng)用
推薦技術(shù)資料
- 業(yè)余條件下PCM2702
- PGM2702采用SSOP28封裝,引腳小而密,EP3... [詳細(xì)]
- 首款新結(jié)構(gòu)硅基外腔混合集成光源芯片
- 全大核架構(gòu) X930 超大核的
- 計(jì)算子系統(tǒng)(Compute Sub Syst
- Neoverse CSS V3 架構(gòu)R
- Arm Neoverse CP
- Dimensity 9400芯
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究