漢字交換碼
發(fā)布時(shí)間:2014/6/1 21:51:01 訪問次數(shù):4967
同西文字符在計(jì)算機(jī)中要用ASCII碼存儲(chǔ)一樣,漢字在計(jì)算機(jī)中也以二進(jìn)制的形式存儲(chǔ),AB2000/TWL93004C但由于漢字的結(jié)構(gòu)與西文不同,而且數(shù)量眾多,其編碼方式相對要復(fù)雜一些。
1.漢字交換碼
為了在信息交換中有通用的規(guī)則,我國于1981年頒布了《信息交換用漢字編碼字符GB2312-80,簡稱國標(biāo)碼。在該標(biāo)準(zhǔn)中,每個(gè)漢字的編碼由16位二進(jìn)制數(shù)表示,占兩個(gè)字節(jié),每個(gè)字節(jié)按照標(biāo)準(zhǔn)ASCII碼的規(guī)則編碼。國標(biāo)碼是重要的漢字交換碼,是漢字在計(jì)算機(jī)中存儲(chǔ)的基礎(chǔ)。但是,如果將漢字和西文字符混合存儲(chǔ),就會(huì)出現(xiàn)混淆。原因在于,對某一個(gè)字節(jié),計(jì)算機(jī)難以判斷該字節(jié)是漢字的第一個(gè)字節(jié),還是一個(gè)西文字符的ASCII碼。因此,國標(biāo)碼不能直接用于漢字的存儲(chǔ),必須進(jìn)行轉(zhuǎn)換。以漢字“萬”
為例,其國標(biāo)碼是4D72H,轉(zhuǎn)換為二進(jìn)制表示是0100 1101 0111 0010。顯然,二進(jìn)制串01001101可以看成是字母。M,的ASCII碼值,而二進(jìn)制串0111 0010可以看成是字母‘r’的ASCII碼值。也就是說,計(jì)算機(jī)既可以把4D72H解釋成漢字“萬”,也可以解釋成兩個(gè)英文
字母rMr,。,出現(xiàn)二義性問題是不允許的。漢字機(jī)內(nèi)碼就是在國標(biāo)碼的基礎(chǔ)上,經(jīng)過簡單轉(zhuǎn)換得到的。
2.漢字機(jī)內(nèi)碼
為了避免出現(xiàn)國標(biāo)碼和ASCII碼之間的沖突問題,研究人員對漢字國標(biāo)碼進(jìn)行了如下轉(zhuǎn)換:將漢字國標(biāo)碼每一個(gè)字節(jié)的最高位變?yōu)閘。仍以漢字“萬”為例,最高位轉(zhuǎn)變后,漢字編碼變?yōu)?100 1101 1111 0010。這樣就解決了漢字編碼同ASCII碼的沖突間題。以上 轉(zhuǎn)變可認(rèn)為是在國標(biāo)碼的基礎(chǔ)之上增加8080H,就得到了漢字機(jī)內(nèi)碼,即:
漢字國標(biāo)碼+ 8080H=漢字機(jī)內(nèi)碼
同西文字符在計(jì)算機(jī)中要用ASCII碼存儲(chǔ)一樣,漢字在計(jì)算機(jī)中也以二進(jìn)制的形式存儲(chǔ),AB2000/TWL93004C但由于漢字的結(jié)構(gòu)與西文不同,而且數(shù)量眾多,其編碼方式相對要復(fù)雜一些。
1.漢字交換碼
為了在信息交換中有通用的規(guī)則,我國于1981年頒布了《信息交換用漢字編碼字符GB2312-80,簡稱國標(biāo)碼。在該標(biāo)準(zhǔn)中,每個(gè)漢字的編碼由16位二進(jìn)制數(shù)表示,占兩個(gè)字節(jié),每個(gè)字節(jié)按照標(biāo)準(zhǔn)ASCII碼的規(guī)則編碼。國標(biāo)碼是重要的漢字交換碼,是漢字在計(jì)算機(jī)中存儲(chǔ)的基礎(chǔ)。但是,如果將漢字和西文字符混合存儲(chǔ),就會(huì)出現(xiàn)混淆。原因在于,對某一個(gè)字節(jié),計(jì)算機(jī)難以判斷該字節(jié)是漢字的第一個(gè)字節(jié),還是一個(gè)西文字符的ASCII碼。因此,國標(biāo)碼不能直接用于漢字的存儲(chǔ),必須進(jìn)行轉(zhuǎn)換。以漢字“萬”
為例,其國標(biāo)碼是4D72H,轉(zhuǎn)換為二進(jìn)制表示是0100 1101 0111 0010。顯然,二進(jìn)制串01001101可以看成是字母。M,的ASCII碼值,而二進(jìn)制串0111 0010可以看成是字母‘r’的ASCII碼值。也就是說,計(jì)算機(jī)既可以把4D72H解釋成漢字“萬”,也可以解釋成兩個(gè)英文
字母rMr,。,出現(xiàn)二義性問題是不允許的。漢字機(jī)內(nèi)碼就是在國標(biāo)碼的基礎(chǔ)上,經(jīng)過簡單轉(zhuǎn)換得到的。
2.漢字機(jī)內(nèi)碼
為了避免出現(xiàn)國標(biāo)碼和ASCII碼之間的沖突問題,研究人員對漢字國標(biāo)碼進(jìn)行了如下轉(zhuǎn)換:將漢字國標(biāo)碼每一個(gè)字節(jié)的最高位變?yōu)閘。仍以漢字“萬”為例,最高位轉(zhuǎn)變后,漢字編碼變?yōu)?100 1101 1111 0010。這樣就解決了漢字編碼同ASCII碼的沖突間題。以上 轉(zhuǎn)變可認(rèn)為是在國標(biāo)碼的基礎(chǔ)之上增加8080H,就得到了漢字機(jī)內(nèi)碼,即:
漢字國標(biāo)碼+ 8080H=漢字機(jī)內(nèi)碼
熱門點(diǎn)擊
- 變量主要由兩個(gè)部分構(gòu)成
- 漢字交換碼
- 偶極子諧振
- Sn-Bi系焊料合金
- 變址尋址
- 倒裝芯片的組裝工藝流程
- 補(bǔ)碼
- X射線檢測BGA. CSP焊點(diǎn)圖像的評估和判
- FPC在技術(shù)上的難點(diǎn)
- 爆米花現(xiàn)象
推薦技術(shù)資料
- 單片機(jī)版光立方的制作
- N視頻: http://v.youku.comN_sh... [詳細(xì)]
- F28P65x C2000 實(shí)時(shí)微控制器
- ARM Cortex-M33 內(nèi)核̴
- 氮化鎵二極管和晶體管̴
- Richtek RT5716設(shè)
- 新一代旗艦芯片麒麟9020應(yīng)用
- 新品WTOLC-4X50H32
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究