字符結(jié)構(gòu)知識(shí)在車(chē)牌識(shí)別中的應(yīng)用
發(fā)布時(shí)間:2008/5/26 0:00:00 訪問(wèn)次數(shù):446
    
    
    摘要:提出了一種完全基于結(jié)構(gòu)知識(shí)的字符識(shí)別方法。該方法以字符的結(jié)構(gòu)特點(diǎn)和筆畫(huà)類(lèi)型、數(shù)據(jù)及位置作為識(shí)別特片生成判定時(shí),再利用判定樹(shù)對(duì)汽車(chē)牌照中的字母和數(shù)字進(jìn)行分類(lèi)識(shí)別。
    
    關(guān)鍵詞:車(chē)牌號(hào)碼 字符結(jié)構(gòu) 判定樹(shù) 字符識(shí)別
    
    汽車(chē)牌照識(shí)別是基于圖像分割和圖像識(shí)別理論,對(duì)含有汽車(chē)牌照的圖像進(jìn)行分析處理,從而確定汽車(chē)牌照在圖像中的位置,并進(jìn)一步提取和識(shí)別出文本字符。從不同車(chē)牌圖像中分割出的字符圖像各式各樣,尺寸變化范圍大,增加了識(shí)別的難度。盡管可以采用圖像變換方法將分割出的所有字符圖像歸一化為相同尺寸,但歸一化過(guò)程又不可避免地丟失有用的字符信息,造成圖像失真,無(wú)助于提高識(shí)別準(zhǔn)確率,并且浪費(fèi)時(shí)間,降低了識(shí)別速度。
    
    本文通過(guò)分析汽車(chē)牌照的特點(diǎn),提出了一種利用字符的筆畫(huà)特征和結(jié)構(gòu)知識(shí)對(duì)汽車(chē)牌照中的字母和數(shù)字進(jìn)行識(shí)別的方法。試驗(yàn)表明,該方法識(shí)別速度快、準(zhǔn)確率高,不受字符圖像大小影響,適應(yīng)性強(qiáng)。
    
    1 車(chē)牌字符結(jié)構(gòu)和識(shí)別
    
    中國(guó)大陸汽車(chē)牌照中使用的字符包括59個(gè)漢字、25個(gè)英文字母(字母i不用)和10個(gè)阿拉伯?dāng)?shù)字三種類(lèi)型共94個(gè),且都是印刷體,結(jié)構(gòu)固定、筆畫(huà)規(guī)范。圖1是車(chē)牌號(hào)碼中使用的全部字母和數(shù)字的圖像。這些字符的結(jié)構(gòu)在水平方向有三種類(lèi)型:左右對(duì)稱(chēng)、左大右小、左小右大。在豎直方向同樣有三種結(jié)構(gòu),即上下對(duì)稱(chēng)、上大下小、上小下大。如車(chē)牌號(hào)碼中使用的數(shù)字"8",就屬于左右對(duì)稱(chēng)且上下對(duì)稱(chēng)。
    
    從圖1可以看出,全部字母和數(shù)字的筆畫(huà)共有兩大類(lèi):直筆畫(huà)和弧筆畫(huà)。直筆畫(huà)又可分為橫筆畫(huà)、豎筆畫(huà)、左斜筆畫(huà)(相當(dāng)于漢字筆畫(huà)中的"撇")和右斜筆畫(huà)(相當(dāng)于漢字筆畫(huà)中的"捺");」P畫(huà)是一條曲線段,本文將其分為兩類(lèi):開(kāi)弧筆畫(huà)和閉弧筆畫(huà)。所謂開(kāi)弧筆畫(huà),指該弧筆畫(huà)沒(méi)有形成封閉環(huán),如字母"c"。而閉弧筆畫(huà)則形成一個(gè)封閉的環(huán),如數(shù)字"0"。
    
    
    
    根據(jù)字符圖像的這一特點(diǎn),本文采用下述方法對(duì)字母和數(shù)字進(jìn)行逐級(jí)分類(lèi),形成一棵識(shí)別判定樹(shù),每個(gè)字符就是一個(gè)葉子:
    
    (1)首先在待識(shí)別的字符圖像中搜索封閉環(huán)的數(shù)量和位置。
    
    (2)根據(jù)搜索到封閉環(huán)的結(jié)果判斷字符所在的類(lèi)封閉環(huán)字符類(lèi)、雙封閉環(huán)字符類(lèi)、無(wú)封閉環(huán)字符類(lèi)。 (3)針對(duì)每一類(lèi)分別進(jìn)行處理。
    
    (4)雙封閉環(huán)字符只有"8"和"b",因此只要抽取豎筆畫(huà)即可區(qū)分出這兩個(gè)字符。"b"的左半部分有一長(zhǎng)豎,而"8"沒(méi)有。
    
    (5)單封閉環(huán)的字符有"a"、"d"、"o"、"p"、"q"、"r"、"0"、"4"、"6"和"9"。根據(jù)封閉環(huán)的位置將這些字符分成三類(lèi):封閉環(huán)在上部;封閉環(huán)在下部和封閉環(huán)在中間,然后再根據(jù)結(jié)構(gòu)特點(diǎn)和抽取的筆畫(huà)特征進(jìn)行識(shí)別。
    
    .封閉環(huán)在上部的字符有"p"、"r"和"9"。如果待識(shí)別字符圖像上半部分有一個(gè)封閉環(huán),則從左半部分抽取豎筆畫(huà);若左側(cè)部分沒(méi)有豎筆畫(huà),則該字符為"9";若在左半部分抽取到豎筆畫(huà),繼續(xù)抽取右斜筆畫(huà);抽取到右斜筆畫(huà),該字符為"r";否則為"p"。
    
    .封閉環(huán)在下部的字符有"a"、"4"和"6"。如果待識(shí)別字符圖像下半部分有一個(gè)封閉環(huán),則從右半部分抽取豎筆畫(huà);若右側(cè)部分有豎筆畫(huà),則該字符為"4";若在右半部分沒(méi)有抽取到豎筆畫(huà),繼續(xù)抽取橫筆畫(huà);抽取到橫筆畫(huà),該字符為"a";否則為"6"。
    
    .封閉環(huán)在中間的字符有"d"、"o"、"q"和"0"。實(shí)際應(yīng)用中,"o"和"0"的圖像完全相同,可以作為同一個(gè)字符處理。如果待識(shí)別字符圖像中間有一個(gè)封閉環(huán),則首先利用上下對(duì)稱(chēng)特點(diǎn)判斷是否為"q";若上下對(duì)稱(chēng),則為"0"("o")或"d";然后按照左右對(duì)稱(chēng)特征區(qū)分字符"0"和"d"。
    
    (6)無(wú)封閉環(huán)的字符有"c"、"e"、"f"、"c"、"h"、"j"、"k"、"l"、"m"、"n"、"s"、"t"、"u"、"v"、"w"、"x"、
    "y"、"z"、"l"、"2"、"3"、"5"和"7
    
    
    摘要:提出了一種完全基于結(jié)構(gòu)知識(shí)的字符識(shí)別方法。該方法以字符的結(jié)構(gòu)特點(diǎn)和筆畫(huà)類(lèi)型、數(shù)據(jù)及位置作為識(shí)別特片生成判定時(shí),再利用判定樹(shù)對(duì)汽車(chē)牌照中的字母和數(shù)字進(jìn)行分類(lèi)識(shí)別。
    
    關(guān)鍵詞:車(chē)牌號(hào)碼 字符結(jié)構(gòu) 判定樹(shù) 字符識(shí)別
    
    汽車(chē)牌照識(shí)別是基于圖像分割和圖像識(shí)別理論,對(duì)含有汽車(chē)牌照的圖像進(jìn)行分析處理,從而確定汽車(chē)牌照在圖像中的位置,并進(jìn)一步提取和識(shí)別出文本字符。從不同車(chē)牌圖像中分割出的字符圖像各式各樣,尺寸變化范圍大,增加了識(shí)別的難度。盡管可以采用圖像變換方法將分割出的所有字符圖像歸一化為相同尺寸,但歸一化過(guò)程又不可避免地丟失有用的字符信息,造成圖像失真,無(wú)助于提高識(shí)別準(zhǔn)確率,并且浪費(fèi)時(shí)間,降低了識(shí)別速度。
    
    本文通過(guò)分析汽車(chē)牌照的特點(diǎn),提出了一種利用字符的筆畫(huà)特征和結(jié)構(gòu)知識(shí)對(duì)汽車(chē)牌照中的字母和數(shù)字進(jìn)行識(shí)別的方法。試驗(yàn)表明,該方法識(shí)別速度快、準(zhǔn)確率高,不受字符圖像大小影響,適應(yīng)性強(qiáng)。
    
    1 車(chē)牌字符結(jié)構(gòu)和識(shí)別
    
    中國(guó)大陸汽車(chē)牌照中使用的字符包括59個(gè)漢字、25個(gè)英文字母(字母i不用)和10個(gè)阿拉伯?dāng)?shù)字三種類(lèi)型共94個(gè),且都是印刷體,結(jié)構(gòu)固定、筆畫(huà)規(guī)范。圖1是車(chē)牌號(hào)碼中使用的全部字母和數(shù)字的圖像。這些字符的結(jié)構(gòu)在水平方向有三種類(lèi)型:左右對(duì)稱(chēng)、左大右小、左小右大。在豎直方向同樣有三種結(jié)構(gòu),即上下對(duì)稱(chēng)、上大下小、上小下大。如車(chē)牌號(hào)碼中使用的數(shù)字"8",就屬于左右對(duì)稱(chēng)且上下對(duì)稱(chēng)。
    
    從圖1可以看出,全部字母和數(shù)字的筆畫(huà)共有兩大類(lèi):直筆畫(huà)和弧筆畫(huà)。直筆畫(huà)又可分為橫筆畫(huà)、豎筆畫(huà)、左斜筆畫(huà)(相當(dāng)于漢字筆畫(huà)中的"撇")和右斜筆畫(huà)(相當(dāng)于漢字筆畫(huà)中的"捺")。弧筆畫(huà)是一條曲線段,本文將其分為兩類(lèi):開(kāi)弧筆畫(huà)和閉弧筆畫(huà)。所謂開(kāi)弧筆畫(huà),指該弧筆畫(huà)沒(méi)有形成封閉環(huán),如字母"c"。而閉弧筆畫(huà)則形成一個(gè)封閉的環(huán),如數(shù)字"0"。
    
    
    
    根據(jù)字符圖像的這一特點(diǎn),本文采用下述方法對(duì)字母和數(shù)字進(jìn)行逐級(jí)分類(lèi),形成一棵識(shí)別判定樹(shù),每個(gè)字符就是一個(gè)葉子:
    
    (1)首先在待識(shí)別的字符圖像中搜索封閉環(huán)的數(shù)量和位置。
    
    (2)根據(jù)搜索到封閉環(huán)的結(jié)果判斷字符所在的類(lèi)封閉環(huán)字符類(lèi)、雙封閉環(huán)字符類(lèi)、無(wú)封閉環(huán)字符類(lèi)。 (3)針對(duì)每一類(lèi)分別進(jìn)行處理。
    
    (4)雙封閉環(huán)字符只有"8"和"b",因此只要抽取豎筆畫(huà)即可區(qū)分出這兩個(gè)字符。"b"的左半部分有一長(zhǎng)豎,而"8"沒(méi)有。
    
    (5)單封閉環(huán)的字符有"a"、"d"、"o"、"p"、"q"、"r"、"0"、"4"、"6"和"9"。根據(jù)封閉環(huán)的位置將這些字符分成三類(lèi):封閉環(huán)在上部;封閉環(huán)在下部和封閉環(huán)在中間,然后再根據(jù)結(jié)構(gòu)特點(diǎn)和抽取的筆畫(huà)特征進(jìn)行識(shí)別。
    
    .封閉環(huán)在上部的字符有"p"、"r"和"9"。如果待識(shí)別字符圖像上半部分有一個(gè)封閉環(huán),則從左半部分抽取豎筆畫(huà);若左側(cè)部分沒(méi)有豎筆畫(huà),則該字符為"9";若在左半部分抽取到豎筆畫(huà),繼續(xù)抽取右斜筆畫(huà);抽取到右斜筆畫(huà),該字符為"r";否則為"p"。
    
    .封閉環(huán)在下部的字符有"a"、"4"和"6"。如果待識(shí)別字符圖像下半部分有一個(gè)封閉環(huán),則從右半部分抽取豎筆畫(huà);若右側(cè)部分有豎筆畫(huà),則該字符為"4";若在右半部分沒(méi)有抽取到豎筆畫(huà),繼續(xù)抽取橫筆畫(huà);抽取到橫筆畫(huà),該字符為"a";否則為"6"。
    
    .封閉環(huán)在中間的字符有"d"、"o"、"q"和"0"。實(shí)際應(yīng)用中,"o"和"0"的圖像完全相同,可以作為同一個(gè)字符處理。如果待識(shí)別字符圖像中間有一個(gè)封閉環(huán),則首先利用上下對(duì)稱(chēng)特點(diǎn)判斷是否為"q";若上下對(duì)稱(chēng),則為"0"("o")或"d";然后按照左右對(duì)稱(chēng)特征區(qū)分字符"0"和"d"。
    
    (6)無(wú)封閉環(huán)的字符有"c"、"e"、"f"、"c"、"h"、"j"、"k"、"l"、"m"、"n"、"s"、"t"、"u"、"v"、"w"、"x"、
    "y"、"z"、"l"、"2"、"3"、"5"和"7
熱門(mén)點(diǎn)擊
- 新型固體LBCAST
- 多媒體PCI接口控制芯片SAA7146A及其
- 視頻解碼芯片CXA2075M
- SG6931功率因素校正晶片及在LCD-TV
- 適于語(yǔ)音處理的SDA80D51芯片及其數(shù)字錄
- CD-ROM格式數(shù)據(jù)的軟解碼模塊設(shè)計(jì)
- 用AC4830xC和TCM38C17實(shí)現(xiàn)四路
- 新型數(shù)字CCD相機(jī)及其圖像數(shù)據(jù)傳輸卡設(shè)計(jì)
- ADSP-TS201S芯片的功能和應(yīng)用
- 機(jī)載電視制導(dǎo)VGA/TV轉(zhuǎn)換器的設(shè)計(jì)與實(shí)現(xiàn)
推薦技術(shù)資料
- 業(yè)余條件下PCM2702
- PGM2702采用SSOP28封裝,引腳小而密,EP3... [詳細(xì)]
- 神經(jīng)運(yùn)算處理芯片(Neural Proces
- GB10 Grace Blac
- 飛行時(shí)間傳感器X-NUCLEO-53L4A2
- 12GB LPDDR5芯片及6
- PowerEdge XE971
- 動(dòng)態(tài)隨機(jī)存取存儲(chǔ)芯片(DRAM
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究