浓毛老太交欧美老妇热爱乱,蜜臀性色av免费,妺妺窝人体色www看美女,久久久久久久久久久大尺度免费视频,麻豆人妻无码性色av专区

位置:51電子網(wǎng) » 技術(shù)資料 » 存 儲 器

按音標(biāo)查詢的英漢電子詞典的設(shè)計與實現(xiàn)

發(fā)布時間:2008/5/27 0:00:00 訪問次數(shù):882

        

    

    

     摘要:系統(tǒng)增加一種功能,即通過音標(biāo)來查詢單詞,同時加入模糊查詢功能,使查詢方式更加靈活和全面。詳細(xì)地說明了系統(tǒng)的設(shè)計思想和實現(xiàn)技術(shù)。 關(guān)鍵詞:按發(fā)音查詢 電子詞典 模糊查詢 目前的各類電子詞典系統(tǒng)在查詢速度、詞庫容量等方面都日趨完善。用戶在英文閱讀時,可以方便快捷地查找生詞的詞義、用法、同義詞或反義詞。然而,就使用方式來講,仍存在欠缺。當(dāng)人們聽英語廣播、看英語節(jié)目或練習(xí)聽力時聽到一個詞的發(fā)音而又不知其含義時,又如何查到單詞的含義呢?按傳統(tǒng)的方法,只能先根據(jù)單詞發(fā)音猜測單詞的拼寫,然后再查詞典。由于英文單詞拼寫不規(guī)范,這種查詢的效率必然很低。 為此,應(yīng)尋求另一種查詢途徑。旨在通過音標(biāo)輸入,根據(jù)單詞發(fā)音直接進(jìn)行查詢,并配合模糊查詢算法,從而為這一問題的解決找到一條途徑。整個設(shè)計涉及到音標(biāo)的提取和輸入、范例數(shù)據(jù)庫的建立、模糊查詢算法、界面的設(shè)計等。1 音標(biāo)的提取和輸入 系統(tǒng)設(shè)計首先考慮音標(biāo)字庫問題。windows自帶的音標(biāo)符號不全且不方便引入,而一些商用軟件,如金山公司的kingsoft phonetic音標(biāo)字體則包含了英式音標(biāo)所需要的基本符號,可在開發(fā)中引入該字體。當(dāng)然,要以合法方式獲得。其方法是在裝有金山詞霸的系統(tǒng)中找到ksphonet.ttf,將其拷貝到開發(fā)系統(tǒng)中,安裝此字體即可。開發(fā)時,將窗口缺省字體設(shè)置為kingsoft phonetic;最后,在程序發(fā)布安裝過程中自動為目標(biāo)機(jī)安裝該字體。 由于無論是建立樣例數(shù)據(jù)庫還是系統(tǒng)運(yùn)行時進(jìn)行查詢,都涉及到音標(biāo)的錄入,而通過鍵盤進(jìn)行錄入顯然不方便。所以在程序窗口中設(shè)置一個音標(biāo)輸入面板,通過點擊面板中的按鈕來錄入對應(yīng)的音標(biāo);還應(yīng)對面板中的按鍵排列做規(guī)劃,例如,雙元音按鈕排列在一個區(qū),方便錄入,見圖2。2 樣例數(shù)據(jù)庫的設(shè)計 本電子詞典系統(tǒng)利用ms access 2000建立了一個含500個單詞左右的樣例詞庫,并使用ms visual c++6.0作為前端工具,采用dao技術(shù)實現(xiàn)對樣例數(shù)據(jù)庫的訪問。 雖然本詞庫的規(guī)模較小,但應(yīng)當(dāng)體現(xiàn)出詞典在詞語分布上的特點。所以,特根據(jù)《郎文英漢雙解詞典》做粗略統(tǒng)計,得出數(shù)據(jù)如表1所示。其中,x、z按所占比例算不足一詞,均按一詞計。表1 單詞選取分布表數(shù)據(jù)庫字段設(shè)計如下: 其中,yinbiao存放單詞的音標(biāo),并作為主關(guān)鍵字;eword為英文單詞;cword為單詞的中文釋義。3 模糊查詢處理3.1 實時匹配的處理 系統(tǒng)可以以兩種方式進(jìn)行查詢:按詞查詢和按音標(biāo)查詢。限于篇幅,本文只討論后者。樣例數(shù)據(jù)庫中以音標(biāo)字段作為主鍵,對于每一輸入,系統(tǒng)都進(jìn)行匹配,將相近的結(jié)果顯示出來。例如,用戶輸入:a:則列表提示:art,arm,army,artist,article…等;若用戶輸入:a:t,則列表提示:art,artist,article…等。如用戶的輸入無法完全匹配,則從列表中選擇第一個匹配作為查詢結(jié)果或提示用戶手動選擇相近的詞條。3.2 重音的處理 英語中多音節(jié)單詞都有各類重音,在音標(biāo)中用重音符號標(biāo)記。重音符號完全可以參加匹配查詢,但考慮到查詢復(fù)雜度和實用性,不將重音符號作為查詢的一部分,即輸入的重音符號在音詢時經(jīng)過預(yù)先處理過濾掉重音號。重音符號只用于建立樣例數(shù)據(jù)庫中的音詞條目,以便在查詢結(jié)果中正確地顯示單詞的完整音標(biāo)。對于音標(biāo)相同重音不同的單詞,同時給出釋義。 3.3 模糊查詢處理 基于音標(biāo)的模糊查詢,類似于很多輸入法提供的“南方模糊音”功能,即以用戶潛在的由于音標(biāo)讀音相似產(chǎn)生的輸入錯誤為基礎(chǔ),對無法直接匹配的輸入進(jìn)行相似的代換并對每一種代換進(jìn)行查找。例如對于音標(biāo)tr很容易與音標(biāo)t∫混淆,因此對于可能出現(xiàn)的習(xí)慣上的錯誤對音標(biāo)進(jìn)行查詢的等價類劃分,本系統(tǒng)做了如下劃分: 需要說明的是,這種劃分只是來源于實際的經(jīng)驗,衡量任何一種劃分成功與否必須通過音標(biāo)的錯誤使用統(tǒng)計和用戶的反饋來確定。對于正常查詢無法查得的音標(biāo),用戶可以有選擇地應(yīng)用以上的等價代碼重新進(jìn)行查找。但應(yīng)用等價代換會非常顯著地降低查詢效率,因此必須對查詢的規(guī)模進(jìn)行限制,如最多開啟三個等價集或者進(jìn)行重新等價劃分等。 另外對于比較長的音標(biāo)輸入,可以將音標(biāo)輸入的前一半或者1/3長度作為模糊查詢的輸入依據(jù),這樣模糊查詢的范圍雖然會有所擴(kuò)大,但是卻節(jié)省了查詢浪費的時間?傊,以等價代換查詢?yōu)榛A(chǔ),可以采用很多策略來限制查詢的復(fù)雜度,但是具體哪一種策略更好,需要對音標(biāo)構(gòu)成和用戶輸入習(xí)慣做大量的統(tǒng)計和實驗得出。查詢流程如圖1所示。在具體的實現(xiàn)上,使用了遞歸函數(shù),其基本算法如下:fuzzysearch(cstring str,int n){length=str.getlength();if(length<=n){exactsearch(str); //完全匹配查找return;}else {//對第n個字母進(jìn)行搜索尋找等價代換;//如果找到則從該等價第一個字母開始進(jìn)行代換

        

    

    

     摘要:系統(tǒng)增加一種功能,即通過音標(biāo)來查詢單詞,同時加入模糊查詢功能,使查詢方式更加靈活和全面。詳細(xì)地說明了系統(tǒng)的設(shè)計思想和實現(xiàn)技術(shù)。 關(guān)鍵詞:按發(fā)音查詢 電子詞典 模糊查詢 目前的各類電子詞典系統(tǒng)在查詢速度、詞庫容量等方面都日趨完善。用戶在英文閱讀時,可以方便快捷地查找生詞的詞義、用法、同義詞或反義詞。然而,就使用方式來講,仍存在欠缺。當(dāng)人們聽英語廣播、看英語節(jié)目或練習(xí)聽力時聽到一個詞的發(fā)音而又不知其含義時,又如何查到單詞的含義呢?按傳統(tǒng)的方法,只能先根據(jù)單詞發(fā)音猜測單詞的拼寫,然后再查詞典。由于英文單詞拼寫不規(guī)范,這種查詢的效率必然很低。 為此,應(yīng)尋求另一種查詢途徑。旨在通過音標(biāo)輸入,根據(jù)單詞發(fā)音直接進(jìn)行查詢,并配合模糊查詢算法,從而為這一問題的解決找到一條途徑。整個設(shè)計涉及到音標(biāo)的提取和輸入、范例數(shù)據(jù)庫的建立、模糊查詢算法、界面的設(shè)計等。1 音標(biāo)的提取和輸入 系統(tǒng)設(shè)計首先考慮音標(biāo)字庫問題。windows自帶的音標(biāo)符號不全且不方便引入,而一些商用軟件,如金山公司的kingsoft phonetic音標(biāo)字體則包含了英式音標(biāo)所需要的基本符號,可在開發(fā)中引入該字體。當(dāng)然,要以合法方式獲得。其方法是在裝有金山詞霸的系統(tǒng)中找到ksphonet.ttf,將其拷貝到開發(fā)系統(tǒng)中,安裝此字體即可。開發(fā)時,將窗口缺省字體設(shè)置為kingsoft phonetic;最后,在程序發(fā)布安裝過程中自動為目標(biāo)機(jī)安裝該字體。 由于無論是建立樣例數(shù)據(jù)庫還是系統(tǒng)運(yùn)行時進(jìn)行查詢,都涉及到音標(biāo)的錄入,而通過鍵盤進(jìn)行錄入顯然不方便。所以在程序窗口中設(shè)置一個音標(biāo)輸入面板,通過點擊面板中的按鈕來錄入對應(yīng)的音標(biāo);還應(yīng)對面板中的按鍵排列做規(guī)劃,例如,雙元音按鈕排列在一個區(qū),方便錄入,見圖2。2 樣例數(shù)據(jù)庫的設(shè)計 本電子詞典系統(tǒng)利用ms access 2000建立了一個含500個單詞左右的樣例詞庫,并使用ms visual c++6.0作為前端工具,采用dao技術(shù)實現(xiàn)對樣例數(shù)據(jù)庫的訪問。 雖然本詞庫的規(guī)模較小,但應(yīng)當(dāng)體現(xiàn)出詞典在詞語分布上的特點。所以,特根據(jù)《郎文英漢雙解詞典》做粗略統(tǒng)計,得出數(shù)據(jù)如表1所示。其中,x、z按所占比例算不足一詞,均按一詞計。表1 單詞選取分布表數(shù)據(jù)庫字段設(shè)計如下: 其中,yinbiao存放單詞的音標(biāo),并作為主關(guān)鍵字;eword為英文單詞;cword為單詞的中文釋義。3 模糊查詢處理3.1 實時匹配的處理 系統(tǒng)可以以兩種方式進(jìn)行查詢:按詞查詢和按音標(biāo)查詢。限于篇幅,本文只討論后者。樣例數(shù)據(jù)庫中以音標(biāo)字段作為主鍵,對于每一輸入,系統(tǒng)都進(jìn)行匹配,將相近的結(jié)果顯示出來。例如,用戶輸入:a:則列表提示:art,arm,army,artist,article…等;若用戶輸入:a:t,則列表提示:art,artist,article…等。如用戶的輸入無法完全匹配,則從列表中選擇第一個匹配作為查詢結(jié)果或提示用戶手動選擇相近的詞條。3.2 重音的處理 英語中多音節(jié)單詞都有各類重音,在音標(biāo)中用重音符號標(biāo)記。重音符號完全可以參加匹配查詢,但考慮到查詢復(fù)雜度和實用性,不將重音符號作為查詢的一部分,即輸入的重音符號在音詢時經(jīng)過預(yù)先處理過濾掉重音號。重音符號只用于建立樣例數(shù)據(jù)庫中的音詞條目,以便在查詢結(jié)果中正確地顯示單詞的完整音標(biāo)。對于音標(biāo)相同重音不同的單詞,同時給出釋義。 3.3 模糊查詢處理 基于音標(biāo)的模糊查詢,類似于很多輸入法提供的“南方模糊音”功能,即以用戶潛在的由于音標(biāo)讀音相似產(chǎn)生的輸入錯誤為基礎(chǔ),對無法直接匹配的輸入進(jìn)行相似的代換并對每一種代換進(jìn)行查找。例如對于音標(biāo)tr很容易與音標(biāo)t∫混淆,因此對于可能出現(xiàn)的習(xí)慣上的錯誤對音標(biāo)進(jìn)行查詢的等價類劃分,本系統(tǒng)做了如下劃分: 需要說明的是,這種劃分只是來源于實際的經(jīng)驗,衡量任何一種劃分成功與否必須通過音標(biāo)的錯誤使用統(tǒng)計和用戶的反饋來確定。對于正常查詢無法查得的音標(biāo),用戶可以有選擇地應(yīng)用以上的等價代碼重新進(jìn)行查找。但應(yīng)用等價代換會非常顯著地降低查詢效率,因此必須對查詢的規(guī)模進(jìn)行限制,如最多開啟三個等價集或者進(jìn)行重新等價劃分等。 另外對于比較長的音標(biāo)輸入,可以將音標(biāo)輸入的前一半或者1/3長度作為模糊查詢的輸入依據(jù),這樣模糊查詢的范圍雖然會有所擴(kuò)大,但是卻節(jié)省了查詢浪費的時間?傊缘葍r代換查詢?yōu)榛A(chǔ),可以采用很多策略來限制查詢的復(fù)雜度,但是具體哪一種策略更好,需要對音標(biāo)構(gòu)成和用戶輸入習(xí)慣做大量的統(tǒng)計和實驗得出。查詢流程如圖1所示。在具體的實現(xiàn)上,使用了遞歸函數(shù),其基本算法如下:fuzzysearch(cstring str,int n){length=str.getlength();if(length<=n){exactsearch(str); //完全匹配查找return;}else {//對第n個字母進(jìn)行搜索尋找等價代換;//如果找到則從該等價第一個字母開始進(jìn)行代換

相關(guān)IC型號

熱門點擊

 

推薦技術(shù)資料

循線機(jī)器人是機(jī)器人入門和
    循線機(jī)器人是機(jī)器人入門和比賽最常用的控制方式,E48S... [詳細(xì)]
版權(quán)所有:51dzw.COM
深圳服務(wù)熱線:13751165337  13692101218
粵ICP備09112631號-6(miitbeian.gov.cn)
公網(wǎng)安備44030402000607
深圳市碧威特網(wǎng)絡(luò)技術(shù)有限公司
付款方式


 復(fù)制成功!