計算機基礎--Unicode碼和ASCII碼的關係

1 ASCII就是編碼英文的26個字母和一些常見的符號,之後擴展了一半。總之是一個字節來做編碼,大於128的部分是一些特殊符號。但ASCII是無法編碼別的東西的,比如說是不存在“中文的ascii碼需要2個字符”這種說法的。ASCII就只有一個字節。 

一共有256個  並不是255個  前128個爲常用的字符 如 運算符 字母 數字等 鍵盤上可以顯示的 後 128個爲 特殊字符 是鍵盤上找不到的字符
重要說明 256個 都認爲是 255 可是 ASCII碼  是從 0開始的 所以爲256個

Unicode是足夠編碼地球上所有的語言了,所以ASCII中所能表示的,Unicode當然全部包括了。Unicode本身是隻有2個字節的,之所以出現UTF-8,UTF-16等等之類,那是爲了針對不同的應用環境,提高整體編碼效率,比如如果某篇文章裏絕大部分是英語(單字節就能表示),就比較適合使用utf-8,而如果絕大部分是中文(需要雙字節),可能就utf-16比較合適了


2 byte 是字節數據類型 ,是有符號型的,佔1 個字節;大小範圍爲-128—127 。char 是字符數據類型 ,是無符號型的,佔2字節(Unicode碼 );大小範圍 是0—65535 ;char是一個16位二進制的Unicode字符,JAVA用char來表示一個字符


3至於UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。

4GBK包含全部中文字符;UTF-8則包含全世界所有國家需要用到的字符。

GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準)
UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 所以,對於英文比較多的論壇 ,使用GBK則每個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。
UTF8是國際編碼,它的通用性比較好,外國人也可以瀏覽論壇,GBK是國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大~
附上ASCII碼錶

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章