浓毛老太交欧美老妇热爱乱,蜜臀性色av免费,妺妺窝人体色www看美女,久久久久久久久久久大尺度免费视频,麻豆人妻无码性色av专区

位置:51電子網(wǎng) » 技術(shù)資料 » 消費(fèi)類電子

灰關(guān)聯(lián)分析與語(yǔ)音/音樂(lè)信號(hào)識(shí)別

發(fā)布時(shí)間:2007/9/11 0:00:00 訪問(wèn)次數(shù):1523

摘要:將灰關(guān)聯(lián)分析方法應(yīng)用于語(yǔ)音/音樂(lè)信號(hào)的分類和識(shí)別,并給出了對(duì)音頻信號(hào)進(jìn)行灰關(guān)聯(lián)分析的方法和步驟。利用語(yǔ)音和音樂(lè)信號(hào)的短時(shí)能量均方根的概率統(tǒng)計(jì)特征建立目標(biāo)的參考數(shù)據(jù)和比較數(shù)據(jù),進(jìn)行語(yǔ)音和音樂(lè)信號(hào)的灰關(guān)聯(lián)分析,確定目標(biāo)識(shí)別與分類的判據(jù),并對(duì)兩類信號(hào)進(jìn)行識(shí)別。仿真結(jié)果表明灰關(guān)聯(lián)分析方法應(yīng)用于音頻信號(hào)分類和識(shí)別具有一定的可行性。


關(guān)鍵詞:灰關(guān)聯(lián)分析 特征 語(yǔ)音和音樂(lè)識(shí)別 仿真
語(yǔ)音和音樂(lè)是兩類最重要的音頻數(shù)據(jù),語(yǔ)音和音樂(lè)的自動(dòng)分類在基于內(nèi)容的音頻檢索、視頻的摘要以及語(yǔ)音識(shí)別等眾多領(lǐng)域都有重要的應(yīng)用價(jià)值。
目前,國(guó)內(nèi)外語(yǔ)音信號(hào)識(shí)別多采用基于感覺(jué)特征(例如響度、音調(diào)、諧度等)和過(guò)零率、功率譜、MFCC系數(shù)等多種語(yǔ)音/音樂(lè)分類特征的模式識(shí)別技術(shù)實(shí)現(xiàn)信號(hào)的自動(dòng)識(shí)別。然而當(dāng)識(shí)別對(duì)象的參數(shù)不完整、不齊全時(shí),這些方法有的不能給出正確可靠的結(jié)果,有的無(wú)法進(jìn)行識(shí)別,有的識(shí)別的可靠性較差。由于語(yǔ)音信號(hào)環(huán)境的復(fù)雜和多變性,語(yǔ)音和音樂(lè)信號(hào)參數(shù)有時(shí)很難完全得到,上述方法在實(shí)際應(yīng)用中存在一定的局限性。
因此,如何有效利用現(xiàn)有的少量音頻數(shù)據(jù),準(zhǔn)確地進(jìn)行了音頻信號(hào)的自動(dòng)分類識(shí)別,尤其是語(yǔ)音和音樂(lè)的分類,并作為提取音頻內(nèi)容語(yǔ)義和結(jié)構(gòu)的重要手段之一,其研究日益引起人們的重視;疑到y(tǒng)理論特別是灰關(guān)聯(lián)分析方法的發(fā)展,為解決這一問(wèn)題提供了問(wèn)題。


圖1


1 語(yǔ)音/音樂(lè)信號(hào)的灰關(guān)聯(lián)分析方法
灰色系統(tǒng)理論屬系統(tǒng)論的范疇,灰色是指信息不完全。灰色系統(tǒng)理主要研究系統(tǒng)模型不明確、行為信息不完全、運(yùn)行機(jī)制不清楚這類系統(tǒng)的建模、預(yù)測(cè)、決策和控制等問(wèn)題。在進(jìn)行序列關(guān)聯(lián)分析時(shí),必須先確定參考數(shù)列,然后比其它序列與參考序列的接近程度,進(jìn)而進(jìn)出判斷;谊P(guān)聯(lián)分析的主要步驟:(1)確定參考序列和比較序列;(2)求灰關(guān)聯(lián)系數(shù);(3)求灰度聯(lián)度;(4)按灰關(guān)聯(lián)度大小排序。
2 參考序列和比較序列的確定
選取一定無(wú)停頓的語(yǔ)音信號(hào)和音樂(lè)信號(hào)作為待識(shí)別音頻信號(hào),音頻信號(hào)的特征提取本質(zhì)上起到了降維作用,用較少的維度表現(xiàn)了時(shí)域上的音頻信號(hào)。考慮到只有在5~20ms的時(shí)間間隔內(nèi)才可以認(rèn)為音頻信號(hào)的特征基本保持不變。因此本文選取短時(shí)能量均方根的概率統(tǒng)計(jì)方法提取語(yǔ)音和音樂(lè)信號(hào)的特征。
圖1(a)和圖2(a)分別為語(yǔ)音和音樂(lè)信號(hào)短時(shí)能量的均方根(RMS)的時(shí)域波形。其采樣頻率均為11025Hz,矩形窗長(zhǎng)度N取10ms,時(shí)間長(zhǎng)度為30s。



式(1)中,x(n)是音頻信號(hào),矩形窗序列沿音頻樣點(diǎn)序列逐幀移動(dòng),每段幀長(zhǎng)度為N。
30s的RMS的概率分布即信號(hào)分布頻數(shù)直方圖如圖1(b)、圖2(b)所示。由圖可知兩分布有效明顯的差異,可以作為識(shí)別語(yǔ)音和音樂(lè)信號(hào)的特片依據(jù)。進(jìn)一步研究發(fā)現(xiàn)其概率分布服從不同參數(shù)時(shí)的廣義X2分布。
選取上述30s的語(yǔ)音和音樂(lè)信號(hào)RMS概率分布作為參考序列,記為xj={xj(k)|k=1,2,…,K},其中x1為語(yǔ)音參序列,x2為音樂(lè)參考序列,記作yi={yi(k)|k=1,2,…,k},其中y1為語(yǔ)音比較數(shù)列,y2為音樂(lè)比較序列。K為特征數(shù)量,本文取K=10。為檢驗(yàn)不同長(zhǎng)度比較序列的灰關(guān)聯(lián)度,特征提取的比較序列時(shí)間長(zhǎng)度分別取0.1s、1s、10s。圖3為與30s的語(yǔ)音和音樂(lè)參考信號(hào)RMS概率分布比較圖。由圖3可知,比較序列的時(shí)間長(zhǎng)度越長(zhǎng),概率分布與參考序列的相似程度就越大,當(dāng)比較序列時(shí)長(zhǎng)為10s時(shí),概率分布幾乎與參考序列吻合。
為保證音頻序列的可比性,在進(jìn)行灰關(guān)聯(lián)分析時(shí),需要對(duì)序列進(jìn)行初值化生成處理,即對(duì)一個(gè)數(shù)列的所有數(shù)據(jù)均用其第一個(gè)數(shù)去除。這個(gè)新序列表明原始數(shù)列中不同時(shí)刻的值相對(duì)于第一個(gè)時(shí)刻值的倍數(shù)。


圖2


3 計(jì)算灰關(guān)聯(lián)系數(shù)
在語(yǔ)音/音樂(lè)識(shí)別中,由于目標(biāo)的類型為兩個(gè),有兩個(gè)參考序列,為區(qū)分不同的類型就需要求一組比較序列與組參考序列的灰關(guān)聯(lián)度。如果在局部環(huán)境下計(jì)算每一組比較序列分別與二組參考序列的灰度聯(lián)系數(shù),則在不同局部條件下所得到的灰關(guān)聯(lián)度將失去可比性。因此,為實(shí)現(xiàn)音頻類型的識(shí)別,在計(jì)算某一個(gè)比較序列與各個(gè)參考序列的灰關(guān)聯(lián)度時(shí),必須是在相同最大值和最小值下計(jì)算,從而得到“全局環(huán)境”的灰關(guān)聯(lián)度系數(shù)。
計(jì)算全局環(huán)境下的灰關(guān)聯(lián)系數(shù)的算法如下:



其中,Nj={1,2},Ni={1,2},K={1,2,…,10},常數(shù)ξ稱為分辨系數(shù),ξ∈[0,1],其作用是調(diào)整比較環(huán)境的大小。ξ越小,分辨力越大。一段取ξ=0.5。minminmin|xj(k)-yi(k)|稱為兩極最小差,maxmaxmax|xj(k)-yi(k)|稱為兩極最大差,|xj(k)-yi(k)|稱為第k個(gè)指標(biāo)xj與yi的絕對(duì)差。
4 計(jì)算灰關(guān)聯(lián)度
灰關(guān)聯(lián)分析的實(shí)質(zhì),就是對(duì)數(shù)列曲線進(jìn)行幾

摘要:將灰關(guān)聯(lián)分析方法應(yīng)用于語(yǔ)音/音樂(lè)信號(hào)的分類和識(shí)別,并給出了對(duì)音頻信號(hào)進(jìn)行灰關(guān)聯(lián)分析的方法和步驟。利用語(yǔ)音和音樂(lè)信號(hào)的短時(shí)能量均方根的概率統(tǒng)計(jì)特征建立目標(biāo)的參考數(shù)據(jù)和比較數(shù)據(jù),進(jìn)行語(yǔ)音和音樂(lè)信號(hào)的灰關(guān)聯(lián)分析,確定目標(biāo)識(shí)別與分類的判據(jù),并對(duì)兩類信號(hào)進(jìn)行識(shí)別。仿真結(jié)果表明灰關(guān)聯(lián)分析方法應(yīng)用于音頻信號(hào)分類和識(shí)別具有一定的可行性。


關(guān)鍵詞:灰關(guān)聯(lián)分析 特征 語(yǔ)音和音樂(lè)識(shí)別 仿真
語(yǔ)音和音樂(lè)是兩類最重要的音頻數(shù)據(jù),語(yǔ)音和音樂(lè)的自動(dòng)分類在基于內(nèi)容的音頻檢索、視頻的摘要以及語(yǔ)音識(shí)別等眾多領(lǐng)域都有重要的應(yīng)用價(jià)值。
目前,國(guó)內(nèi)外語(yǔ)音信號(hào)識(shí)別多采用基于感覺(jué)特征(例如響度、音調(diào)、諧度等)和過(guò)零率、功率譜、MFCC系數(shù)等多種語(yǔ)音/音樂(lè)分類特征的模式識(shí)別技術(shù)實(shí)現(xiàn)信號(hào)的自動(dòng)識(shí)別。然而當(dāng)識(shí)別對(duì)象的參數(shù)不完整、不齊全時(shí),這些方法有的不能給出正確可靠的結(jié)果,有的無(wú)法進(jìn)行識(shí)別,有的識(shí)別的可靠性較差。由于語(yǔ)音信號(hào)環(huán)境的復(fù)雜和多變性,語(yǔ)音和音樂(lè)信號(hào)參數(shù)有時(shí)很難完全得到,上述方法在實(shí)際應(yīng)用中存在一定的局限性。
因此,如何有效利用現(xiàn)有的少量音頻數(shù)據(jù),準(zhǔn)確地進(jìn)行了音頻信號(hào)的自動(dòng)分類識(shí)別,尤其是語(yǔ)音和音樂(lè)的分類,并作為提取音頻內(nèi)容語(yǔ)義和結(jié)構(gòu)的重要手段之一,其研究日益引起人們的重視。灰色系統(tǒng)理論特別是灰關(guān)聯(lián)分析方法的發(fā)展,為解決這一問(wèn)題提供了問(wèn)題。


圖1


1 語(yǔ)音/音樂(lè)信號(hào)的灰關(guān)聯(lián)分析方法
灰色系統(tǒng)理論屬系統(tǒng)論的范疇,灰色是指信息不完全。灰色系統(tǒng)理主要研究系統(tǒng)模型不明確、行為信息不完全、運(yùn)行機(jī)制不清楚這類系統(tǒng)的建模、預(yù)測(cè)、決策和控制等問(wèn)題。在進(jìn)行序列關(guān)聯(lián)分析時(shí),必須先確定參考數(shù)列,然后比其它序列與參考序列的接近程度,進(jìn)而進(jìn)出判斷;谊P(guān)聯(lián)分析的主要步驟:(1)確定參考序列和比較序列;(2)求灰關(guān)聯(lián)系數(shù);(3)求灰度聯(lián)度;(4)按灰關(guān)聯(lián)度大小排序。
2 參考序列和比較序列的確定
選取一定無(wú)停頓的語(yǔ)音信號(hào)和音樂(lè)信號(hào)作為待識(shí)別音頻信號(hào),音頻信號(hào)的特征提取本質(zhì)上起到了降維作用,用較少的維度表現(xiàn)了時(shí)域上的音頻信號(hào)。考慮到只有在5~20ms的時(shí)間間隔內(nèi)才可以認(rèn)為音頻信號(hào)的特征基本保持不變。因此本文選取短時(shí)能量均方根的概率統(tǒng)計(jì)方法提取語(yǔ)音和音樂(lè)信號(hào)的特征。
圖1(a)和圖2(a)分別為語(yǔ)音和音樂(lè)信號(hào)短時(shí)能量的均方根(RMS)的時(shí)域波形。其采樣頻率均為11025Hz,矩形窗長(zhǎng)度N取10ms,時(shí)間長(zhǎng)度為30s。



式(1)中,x(n)是音頻信號(hào),矩形窗序列沿音頻樣點(diǎn)序列逐幀移動(dòng),每段幀長(zhǎng)度為N。
30s的RMS的概率分布即信號(hào)分布頻數(shù)直方圖如圖1(b)、圖2(b)所示。由圖可知兩分布有效明顯的差異,可以作為識(shí)別語(yǔ)音和音樂(lè)信號(hào)的特片依據(jù)。進(jìn)一步研究發(fā)現(xiàn)其概率分布服從不同參數(shù)時(shí)的廣義X2分布。
選取上述30s的語(yǔ)音和音樂(lè)信號(hào)RMS概率分布作為參考序列,記為xj={xj(k)|k=1,2,…,K},其中x1為語(yǔ)音參序列,x2為音樂(lè)參考序列,記作yi={yi(k)|k=1,2,…,k},其中y1為語(yǔ)音比較數(shù)列,y2為音樂(lè)比較序列。K為特征數(shù)量,本文取K=10。為檢驗(yàn)不同長(zhǎng)度比較序列的灰關(guān)聯(lián)度,特征提取的比較序列時(shí)間長(zhǎng)度分別取0.1s、1s、10s。圖3為與30s的語(yǔ)音和音樂(lè)參考信號(hào)RMS概率分布比較圖。由圖3可知,比較序列的時(shí)間長(zhǎng)度越長(zhǎng),概率分布與參考序列的相似程度就越大,當(dāng)比較序列時(shí)長(zhǎng)為10s時(shí),概率分布幾乎與參考序列吻合。
為保證音頻序列的可比性,在進(jìn)行灰關(guān)聯(lián)分析時(shí),需要對(duì)序列進(jìn)行初值化生成處理,即對(duì)一個(gè)數(shù)列的所有數(shù)據(jù)均用其第一個(gè)數(shù)去除。這個(gè)新序列表明原始數(shù)列中不同時(shí)刻的值相對(duì)于第一個(gè)時(shí)刻值的倍數(shù)。


圖2


3 計(jì)算灰關(guān)聯(lián)系數(shù)
在語(yǔ)音/音樂(lè)識(shí)別中,由于目標(biāo)的類型為兩個(gè),有兩個(gè)參考序列,為區(qū)分不同的類型就需要求一組比較序列與組參考序列的灰關(guān)聯(lián)度。如果在局部環(huán)境下計(jì)算每一組比較序列分別與二組參考序列的灰度聯(lián)系數(shù),則在不同局部條件下所得到的灰關(guān)聯(lián)度將失去可比性。因此,為實(shí)現(xiàn)音頻類型的識(shí)別,在計(jì)算某一個(gè)比較序列與各個(gè)參考序列的灰關(guān)聯(lián)度時(shí),必須是在相同最大值和最小值下計(jì)算,從而得到“全局環(huán)境”的灰關(guān)聯(lián)度系數(shù)。
計(jì)算全局環(huán)境下的灰關(guān)聯(lián)系數(shù)的算法如下:



其中,Nj={1,2},Ni={1,2},K={1,2,…,10},常數(shù)ξ稱為分辨系數(shù),ξ∈[0,1],其作用是調(diào)整比較環(huán)境的大小。ξ越小,分辨力越大。一段取ξ=0.5。minminmin|xj(k)-yi(k)|稱為兩極最小差,maxmaxmax|xj(k)-yi(k)|稱為兩極最大差,|xj(k)-yi(k)|稱為第k個(gè)指標(biāo)xj與yi的絕對(duì)差。
4 計(jì)算灰關(guān)聯(lián)度
灰關(guān)聯(lián)分析的實(shí)質(zhì),就是對(duì)數(shù)列曲線進(jìn)行幾

相關(guān)IC型號(hào)

熱門(mén)點(diǎn)擊

 

推薦技術(shù)資料

中國(guó)傳媒大學(xué)傳媒博物館開(kāi)
    傳媒博物館開(kāi)館儀式隆童舉行。教育都i國(guó)家廣電總局等部門(mén)... [詳細(xì)]
版權(quán)所有:51dzw.COM
深圳服務(wù)熱線:13751165337  13692101218
粵ICP備09112631號(hào)-6(miitbeian.gov.cn)
公網(wǎng)安備44030402000607
深圳市碧威特網(wǎng)絡(luò)技術(shù)有限公司
付款方式


 復(fù)制成功!