java編程 Java如何判斷字符串亂碼,字符串的編碼方式是utf-8?
Java如何判斷字符串亂碼,字符串的編碼方式是utf-8?在計(jì)算機(jī)中,任何文本都以指定的編碼方式存儲(chǔ)。Java中常用的幾種編碼方法有:UTF、iso8859-1、GBK、Unicode。iso8859
Java如何判斷字符串亂碼,字符串的編碼方式是utf-8?
在計(jì)算機(jī)中,任何文本都以指定的編碼方式存儲(chǔ)。Java中常用的幾種編碼方法有:UTF、iso8859-1、GBK、Unicode。
iso8859-1屬于單一編碼,只能表示0~255個(gè)字符,主要用于英文
GBK中國(guó)國(guó)標(biāo)編碼,主要表示漢字,是雙字節(jié)編碼
Unicode的標(biāo)準(zhǔn)碼之一,使用十六進(jìn)制代碼,這與iso8859-1不兼容
UTF代碼是變長(zhǎng)代碼,每個(gè)字符的長(zhǎng)度從1到6字節(jié)不等。
亂碼,主要是因?yàn)槌绦驔](méi)有處理字符編碼,比如默認(rèn)編碼是UTF,但是在程序中使用iso8859-1編碼,然后亂碼。造成亂碼的根本原因是字符編碼的不統(tǒng)一。
日本的文字里有很多漢字,為什么是簡(jiǎn)體而不是繁體?
日語(yǔ)字符是在漢字的基礎(chǔ)上創(chuàng)建的,俗稱“假名”。日文漢字的創(chuàng)造有兩種方式:片假名,取自中國(guó)楷書(shū)的側(cè)面;平假名,源自中國(guó)草書(shū)。平假名屬于拼音字,同一個(gè)漢字在漢語(yǔ)和日語(yǔ)中的意義可能有很大的不同。
簡(jiǎn)化漢字的方法是基于錢(qián)玄同1922年提出的方法:1。使用簡(jiǎn)單的古代漢字。使用楷書(shū)草書(shū)。用簡(jiǎn)單的符號(hào)代替復(fù)雜的部首。只保留原文字的特征部分。將原來(lái)的形聲字改為簡(jiǎn)單的拼音字。保留了原漢字的輪廓;7在不引起混淆的情況下,同音詞被合并成簡(jiǎn)單的同音詞。
這就是為什么日語(yǔ)中的許多“漢字”與簡(jiǎn)體字相互關(guān)聯(lián),但其含義卻截然不同的原因。其實(shí),古人造字時(shí),字并不復(fù)雜。在漢字的演變過(guò)程中,統(tǒng)治階級(jí)和文人出于自身的需要,刻意將漢字變得越來(lái)越復(fù)雜、晦澀。對(duì)他們來(lái)說(shuō),能讀書(shū)的人越少越好,而文人墨客他們不需要公眾能讀書(shū)!