gb2312編碼一個(gè)漢字幾個(gè)字節(jié) GB2312編碼的字符在計(jì)算機(jī)中存儲(chǔ)時(shí)使用幾個(gè)字節(jié)?
GB2312編碼的字符在計(jì)算機(jī)中存儲(chǔ)時(shí)使用幾個(gè)字節(jié)?在使用GB2312的程序中,為了與ASCII兼容,通常使用EUC存儲(chǔ)方法?!睘g覽器代碼表中的“GB2312”通常指“euc cn”。每個(gè)字符和符號(hào)由
GB2312編碼的字符在計(jì)算機(jī)中存儲(chǔ)時(shí)使用幾個(gè)字節(jié)?
在使用GB2312的程序中,為了與ASCII兼容,通常使用EUC存儲(chǔ)方法。”瀏覽器代碼表中的“GB2312”通常指“euc cn”。每個(gè)字符和符號(hào)由兩個(gè)字節(jié)表示。第一個(gè)字節(jié)稱為“高字節(jié)”(也稱為“區(qū)域字節(jié)”),第二個(gè)字節(jié)稱為“低字節(jié)”(也稱為“位字節(jié)”)“高字節(jié)”使用0xa1-0xf7(將0xa0添加到區(qū)域01-87的區(qū)號(hào)中),“低字節(jié)”使用0xa1-0xfe(將0xa0添加到區(qū)域01-94中)。因?yàn)榈谝患?jí)漢字是從16區(qū)開始的,所以漢字區(qū)的“高字節(jié)”范圍是0xb0-0xf7,“低字節(jié)”范圍是0xa1-0xfe,占用的碼位是72*94=6768。其中5個(gè)是d7fa-d7fe。例如,在大多數(shù)程序中,單詞“ah”存儲(chǔ)為兩個(gè)字節(jié),0xb0(第一個(gè)字節(jié))和0xa1(第二個(gè)字節(jié))。位置碼=區(qū)域字節(jié)(與位置碼比較:0xb0=0xa0 16,0xa1=0xa0 1)。
GB2312編碼的字符在計(jì)算機(jī)中存儲(chǔ)時(shí)使用幾個(gè)字節(jié)?
GB2312的內(nèi)部代碼是每個(gè)漢字2個(gè)字節(jié),每個(gè)字節(jié)的最高位是1。
將上述十六進(jìn)制轉(zhuǎn)換為二進(jìn)制:
6ah=01101000B
b1H=10110001b
D2H=11010010b
53h=01010011b
C8H=11001000b
B4H=10110100b
6ah的最高位是0,不是漢字。
b1H和D2H的最高順序是1,這是一個(gè)漢字。
53h的最高位是0,不是漢字。
C8H和B4H的最高順序是1,這是一個(gè)漢字。
所以這個(gè)字符串中有兩個(gè)漢字。
漢字國際碼把漢字分為幾個(gè)等級(jí)?
GB2312-80漢字國家標(biāo)準(zhǔn)碼將漢字分為兩級(jí):一級(jí)漢字和二級(jí)漢字。一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)。
信息交換用漢字編碼字符集是國家標(biāo)準(zhǔn)局于1980年頒布的一套國家標(biāo)準(zhǔn),1981年5月1日實(shí)施。標(biāo)準(zhǔn)編號(hào)為GB 2312-1980。
GB2312標(biāo)準(zhǔn)共有6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè)。同時(shí),GB2312包含682個(gè)全寬字符,包括拉丁語、希臘語、日語平假名和片假名、俄語西里爾文。漢字基本上符合GB2312的外觀要求。它收集的漢字已占中國大陸使用頻率的99.75%。GB2312不能處理人名和古漢語中很少使用的字符,導(dǎo)致了GBK和GB18030字符集的出現(xiàn)。