成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

字符編碼ascii unicode字符集是unicode聯(lián)盟開(kāi)發(fā)的一種多少位字符編碼標(biāo)準(zhǔn)?

unicode字符集是unicode聯(lián)盟開(kāi)發(fā)的一種多少位字符編碼標(biāo)準(zhǔn)?最初的Unicode編碼是固定長(zhǎng)度的,16位,即表示一個(gè)字符的兩個(gè)字節(jié),因此總共可以表示65536個(gè)字符。顯然,這還不足以用各種語(yǔ)

unicode字符集是unicode聯(lián)盟開(kāi)發(fā)的一種多少位字符編碼標(biāo)準(zhǔn)?

最初的Unicode編碼是固定長(zhǎng)度的,16位,即表示一個(gè)字符的兩個(gè)字節(jié),因此總共可以表示65536個(gè)字符。顯然,這還不足以用各種語(yǔ)言來(lái)表示所有字符。unicode4.0規(guī)范考慮了這種情況,并定義了一組附加字符代碼。附加字符代碼由兩個(gè)16位表示,因此最多可以定義1048576個(gè)附加字符。目前,Unicode 4.0中只定義了45960個(gè)附加字符。

Unicode只是一種編碼規(guī)范。目前,Unicode編碼只有三種:UTF-8、ucs-2和UTF-16。這三種Unicode字符集可以根據(jù)規(guī)范進(jìn)行轉(zhuǎn)換。

unicode字符集是unicode聯(lián)盟開(kāi)發(fā)的一種多少位字符編碼標(biāo)準(zhǔn)?

Unicode代碼擴(kuò)展自ASCII字符集。在嚴(yán)格的ASCII中,每個(gè)字符由7位或8位寬表示,這在計(jì)算機(jī)上是常用的,而Unicode使用完整的16位字符集。這使得Unicode能夠表示字符、象形文字和其他符號(hào),這些符號(hào)可以用世界上所有的書(shū)寫(xiě)語(yǔ)言進(jìn)行計(jì)算機(jī)通信。Unicode最初是作為ASCII的補(bǔ)充,如果可能的話,最終將取代它??紤]到ASCII是計(jì)算機(jī)中最主要的標(biāo)準(zhǔn),這確實(shí)是一個(gè)很高的目標(biāo)。

Unicode影響到計(jì)算機(jī)行業(yè)的每一個(gè)部分,但對(duì)操作系統(tǒng)和編程語(yǔ)言的影響可能最大。這樣,我們就在路上了。windowsnt從底層支持Unicode。

目前,計(jì)算機(jī)中使用最廣泛的字符集及其編碼是美國(guó)國(guó)家標(biāo)準(zhǔn)局(ANSI)開(kāi)發(fā)的美國(guó)信息交換標(biāo)準(zhǔn)碼(ASCII)。它已被國(guó)際標(biāo)準(zhǔn)化組織(ISO)定為國(guó)際標(biāo)準(zhǔn),稱為iso646標(biāo)準(zhǔn)。適合所有拉丁字母,ASCII碼有7位碼和8位碼。

Unicode中只有一個(gè)字符集。在Unicode中,中文、日文和韓文字符占據(jù)0x3000到0x9fff的部分。目前,ucs-2在Unicode中得到了廣泛的應(yīng)用,它將一個(gè)字符編碼為兩個(gè)字節(jié)。例如,漢字“京”的編碼是0x7ecf。注意,字符編碼通常用十六進(jìn)制表示。為了區(qū)別于十進(jìn)制,十六進(jìn)制從0x開(kāi)始,0x7ecf轉(zhuǎn)換成十個(gè)十六進(jìn)制,是32463,ucs-2用兩個(gè)字節(jié)編碼字符,兩個(gè)字節(jié)是16位二進(jìn)制,2的16次方等于65536,所以u(píng)cs-2最多只能編碼65536個(gè)字符。從0到127編碼的字符與ASCII字符相同。例如,字母“a”的Unicode代碼是0x0061,十進(jìn)制是97,而“a”的ASCII代碼是0x61,十進(jìn)制是97。對(duì)于漢字編碼,實(shí)際上Unicode并不能很好地支持漢字。簡(jiǎn)體中文和繁體中文都有6萬(wàn)或7萬(wàn)個(gè)漢字,而ucs-2最多只能代表65536個(gè)漢字,超過(guò)6萬(wàn)個(gè)漢字,因此Unicode只能排除一些不常用的漢字。幸運(yùn)的是,常用的簡(jiǎn)體字只有7000多個(gè)。為了表示所有的漢字,Unicode還有ucs-4規(guī)范,它使用4個(gè)字節(jié)來(lái)編碼字符

ASCII是對(duì)26個(gè)英文字母和一些常用符號(hào)進(jìn)行編碼,然后擴(kuò)展一半??傊且粋€(gè)字節(jié)用于編碼,大于128的部分是一些特殊符號(hào)。但是ASCII不能編碼其他任何東西。例如,沒(méi)有說(shuō)“中國(guó)ASCII碼需要2個(gè)字符”。ASCII只有一個(gè)字節(jié)。Unicode足以編碼地球上所有的語(yǔ)言,因此它包括所有可以用ASCII表示的語(yǔ)言。Unicode本身只有兩個(gè)字節(jié)。UTF-8、UTF-16等的出現(xiàn)是為了根據(jù)不同的應(yīng)用環(huán)境提高整體編碼效率。例如,如果一篇文章的大部分是英文的(可以用一個(gè)字節(jié)來(lái)表示),UTF-8更合適。如果文章大部分是中文(需要兩個(gè)字節(jié)),utf-16可能更適合復(fù)制當(dāng)然,Unicode是非常常見(jiàn)的。一般來(lái)說(shuō),手機(jī)上的電子書(shū)只能用unode-TXT編碼