基于16位單片機的語音電子門鎖系統(tǒng)
發(fā)布時間:2007/4/23 0:00:00 訪問次數(shù):538
關(guān)鍵詞:聲紋識別 基于周期 線性預(yù)測 模式匹配 DTW
生物識別技術(shù)是利用人體生物特征進行身份認證的一種技術(shù),是目前公認的最為方便與安全的識別技術(shù)。由于每個人的生物特征具有與其他人不同的唯一和在一定時期內(nèi)不變的穩(wěn)定性,不易偽造和假冒,所以利用牲識別和技術(shù)進行身份認證,安全、準確、可靠。
在生物識別領(lǐng)域中,聲紋識別,也稱為說話人識別,以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并且益成為人們?nèi)粘I詈凸ぷ髦兄匾移毡榈陌踩J證方式。聲紋識別是一種根據(jù)說話人語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說明人身份的技術(shù)。
聲紋識技術(shù)可分為兩類,即說話人辨認和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是否是指定的某個人所說的,是一對一判別的問題。從另一方面,聲紋識別又有與文本有關(guān)和與文本無關(guān)兩種,根據(jù)特定的任務(wù)和應(yīng)用,應(yīng)用范圍不同。與文本有關(guān)的聲紋識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達到較好的識別效果;而與文本無關(guān)的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對困難,但用戶使用方便,應(yīng)用范圍較寬。
本文介紹的語音電子門鎖是一種在凌陽16位單片機SPCE061A上實現(xiàn)的與文本有關(guān)的說話人確認系統(tǒng)。該系統(tǒng)主要由說話人識別模塊、門鎖控制電機以及門鎖等部分組成。在訓練時,說話人的聲音通過麥克風進入說話人語音信號采集前端電路,由語音信號處理電路對采集的語音信號進行特征化和語音處理,提取說話人的個性特征參數(shù)并進行存儲,形成說話人特征參數(shù)數(shù)據(jù)庫。在識別時,將待識別語音與說話人特征參數(shù)數(shù)據(jù)庫進行匹配,通過輸出電路控制門鎖電機,最終實現(xiàn)對門鎖的控制。
1 算法原理
說話人識別算法原理框圖如圖1所示。
1.1 預(yù)處理
(1)去噪
對麥克風輸入的模擬語音信號進行量化和采樣,獲得數(shù)字化的語音信號;再將含噪的語音信號通過去噪處理,得到干凈的語音信號后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號的高頻部分,而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。
(2)端點檢測
本系統(tǒng)采用語音信號的短時能量和短時過零率進行端點檢測。語音信號的采樣頻率為8kHz,每幀數(shù)據(jù)為20ms,共計160個采樣點。每隔20ms計算一次短時能量和短時過零率。通過對語音信號的短時能量和短時過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對求取基音、LPCC等特征參數(shù)非常有用的濁音信號。
1.2 特征提取
在語音信號預(yù)處理后,接著是特征參數(shù)的提取。特征提取的任務(wù)就是提取語音信號中表征人的基本特征。
1.2.1 特征參數(shù)的選取
選取的特征必須能夠有效地區(qū)分不同的說話人,且對同一說話人的變化保持相對穩(wěn)定,同時要求特征參數(shù)計算簡便,最好有高效快速算法,以保證識別的實時性。
說話人特征大體可歸為下述幾類:
(1)基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。如譜包絡(luò)、基音、共振峰等。其中基音能夠很好地刻畫說話人的聲帶特征,在很大程度上反映了人的個性特征。
(2)基于聲道特征模型,通過線性預(yù)測分析得到的參數(shù)。包括線性預(yù)測系數(shù)(LPC)以及由線性預(yù)測導出的各種參數(shù),如線性預(yù)測倒譜系數(shù)(LPCC)、部分相關(guān)系數(shù)、反射系數(shù)、對數(shù)面積比、LSP線譜對、線性預(yù)測殘差等。根據(jù)前人的工作成果和實際測試比較,LPCC參數(shù)不但能較好地反饋聲道的共振峰特性,具有較好地識別效果,而且可以用比較簡單的運算和較快的速度求得。
(3)基于人耳的聽覺機理,反映聽覺特性,模擬人耳對聲音頻率感知的特征參數(shù)。如美國
關(guān)鍵詞:聲紋識別 基于周期 線性預(yù)測 模式匹配 DTW
生物識別技術(shù)是利用人體生物特征進行身份認證的一種技術(shù),是目前公認的最為方便與安全的識別技術(shù)。由于每個人的生物特征具有與其他人不同的唯一和在一定時期內(nèi)不變的穩(wěn)定性,不易偽造和假冒,所以利用牲識別和技術(shù)進行身份認證,安全、準確、可靠。
在生物識別領(lǐng)域中,聲紋識別,也稱為說話人識別,以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并且益成為人們?nèi)粘I詈凸ぷ髦兄匾移毡榈陌踩J證方式。聲紋識別是一種根據(jù)說話人語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說明人身份的技術(shù)。
聲紋識技術(shù)可分為兩類,即說話人辨認和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是若干人中的哪一個所說的,是多選一的問題;而后者用以確認某段語音是否是指定的某個人所說的,是一對一判別的問題。從另一方面,聲紋識別又有與文本有關(guān)和與文本無關(guān)兩種,根據(jù)特定的任務(wù)和應(yīng)用,應(yīng)用范圍不同。與文本有關(guān)的聲紋識別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規(guī)定的內(nèi)容發(fā)音,因此可以達到較好的識別效果;而與文本無關(guān)的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內(nèi)容,模型建立相對困難,但用戶使用方便,應(yīng)用范圍較寬。
本文介紹的語音電子門鎖是一種在凌陽16位單片機SPCE061A上實現(xiàn)的與文本有關(guān)的說話人確認系統(tǒng)。該系統(tǒng)主要由說話人識別模塊、門鎖控制電機以及門鎖等部分組成。在訓練時,說話人的聲音通過麥克風進入說話人語音信號采集前端電路,由語音信號處理電路對采集的語音信號進行特征化和語音處理,提取說話人的個性特征參數(shù)并進行存儲,形成說話人特征參數(shù)數(shù)據(jù)庫。在識別時,將待識別語音與說話人特征參數(shù)數(shù)據(jù)庫進行匹配,通過輸出電路控制門鎖電機,最終實現(xiàn)對門鎖的控制。
1 算法原理
說話人識別算法原理框圖如圖1所示。
1.1 預(yù)處理
(1)去噪
對麥克風輸入的模擬語音信號進行量化和采樣,獲得數(shù)字化的語音信號;再將含噪的語音信號通過去噪處理,得到干凈的語音信號后并通過預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的工頻干擾,提升語音信號的高頻部分,而且它還可以起到消除直流漂移、抑制隨機噪聲和提升清音部分能量的作用。
(2)端點檢測
本系統(tǒng)采用語音信號的短時能量和短時過零率進行端點檢測。語音信號的采樣頻率為8kHz,每幀數(shù)據(jù)為20ms,共計160個采樣點。每隔20ms計算一次短時能量和短時過零率。通過對語音信號的短時能量和短時過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對求取基音、LPCC等特征參數(shù)非常有用的濁音信號。
1.2 特征提取
在語音信號預(yù)處理后,接著是特征參數(shù)的提取。特征提取的任務(wù)就是提取語音信號中表征人的基本特征。
1.2.1 特征參數(shù)的選取
選取的特征必須能夠有效地區(qū)分不同的說話人,且對同一說話人的變化保持相對穩(wěn)定,同時要求特征參數(shù)計算簡便,最好有高效快速算法,以保證識別的實時性。
說話人特征大體可歸為下述幾類:
(1)基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。如譜包絡(luò)、基音、共振峰等。其中基音能夠很好地刻畫說話人的聲帶特征,在很大程度上反映了人的個性特征。
(2)基于聲道特征模型,通過線性預(yù)測分析得到的參數(shù)。包括線性預(yù)測系數(shù)(LPC)以及由線性預(yù)測導出的各種參數(shù),如線性預(yù)測倒譜系數(shù)(LPCC)、部分相關(guān)系數(shù)、反射系數(shù)、對數(shù)面積比、LSP線譜對、線性預(yù)測殘差等。根據(jù)前人的工作成果和實際測試比較,LPCC參數(shù)不但能較好地反饋聲道的共振峰特性,具有較好地識別效果,而且可以用比較簡單的運算和較快的速度求得。
(3)基于人耳的聽覺機理,反映聽覺特性,模擬人耳對聲音頻率感知的特征參數(shù)。如美國
熱門點擊
- 8051單片機家族數(shù)據(jù)手冊鏈接大全
- dsPIC30F6010單片機的原理及應(yīng)用
- 一種通用的嵌入式系統(tǒng)ISP方法
- 浮點數(shù)保存代碼
- 基于FPGA/CPLD和USB技術(shù)的無損圖像
- 數(shù)字顯示器仍需處理模擬信號
- 常用PIC系列8位單片機芯片引腳符號的功能
- PIC系列單片機的偽指令
- 利用單片機PWM信號進行舵機控制
- 產(chǎn)生低失真正弦波的CMOS六角反相器
推薦技術(shù)資料
- 硬盤式MP3播放器終級改
- 一次偶然的機會我結(jié)識了NE0 2511,那是一個遠方的... [詳細]
- CV/CC InnoSwitch3-AQ 開
- URF1DxxM-60WR3系
- 1-6W URA24xxN-x
- 閉環(huán)磁通門信號調(diào)節(jié)芯片NSDRV401
- SK-RiSC-SOM-H27X-V1.1應(yīng)
- RISC技術(shù)8位微控制器參數(shù)設(shè)
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究