首頁常見問題正文

字符集是什么?Unicode字符集和ASCII字符集

更新時間:2023-08-22 來源:黑馬程序員 瀏覽量:

字符集(Character Set)是多個字符的集合,字符集種類較多,每個字符集包含的字符個數(shù)不同,常見字符集有ASCII字符集、GBK字符集和Unicode(UTF-8)字符集等。下面來詳細介紹。

ASCII字符集:

ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼):包括了數(shù)字、英文、符號。ASCII使用1個字節(jié)存儲一個字符,一個字節(jié)是8位,總共可以表示128個字符信息,對于表示英文、數(shù)字來說是夠用的。

1691474574105_字符集.png

GBK:

GBK是中國的碼表,包含了幾萬個漢字等字符,同時也要兼容ASCII編碼,GBK編碼中一個中文字符一般以兩個字節(jié)的形式存儲。UTF-8編碼后一個中文一般以三個字節(jié)的形式存儲,同時也要兼容ASCII編碼表。技術(shù)人員都應該使用UTF-8的字符集編碼。

Unicode字符集:

統(tǒng)一碼,也叫萬國碼。是計算機科學領(lǐng)域里的一項業(yè)界標準。UTF-8是Unicode的一種常見編碼方式。字符解碼時使用的字符集和編碼時使用的字符集必須一致,否則會出現(xiàn)亂碼。

例如漢字存儲和展示過程解析如下:

1691475671731_漢字儲存解析過程.png

注意:英文和數(shù)字在任何國家的編碼中都不會亂碼。

使用程序進行編碼解碼可以選擇String類的構(gòu)造器,具體方法如下:

String編碼

1691475906856_編碼.png

String解碼

1691476126260_解碼.png

分享到:
在線咨詢 我要報名
和我們在線交談!