用utf-8還是GBK

編碼只是表示字符一種方式,字符還是那個字符,只不過其數值表示的不一樣而已。字體、樣式和用什麼編碼表示字符沒有任何關係。不可能存在UTF-8達不到的效果。除非你處理字符串的方式有問題,例如後臺程序寫死了一箇中文等於兩個字節。或者你的css文件編碼有問題。例如html用了UTF-8編碼,而css文件用了GB編碼,又沒有用charset指定css的編碼等等。而對於前臺HTML來說,無論頁面什麼編碼,JavaScript內建的字符串類型是UTF-16編碼的,不存在任何問題。 UTF-8的編碼是變長的,從1字節(兼容ASCII)到4字節不等。用UTF-8的好處是它能表示任意Unicode字符,而GBK/GB2312做不到,除了不能表示一些外國文字外,一些古老的中文(如康熙字典裏的一些字)也不能表示,但在Unicode裏就有。後來發展出的GB18030可以表示任意Unicode字符,也是變長編碼,兼容GBK,最長4個字節。編碼問題是很麻煩的事情,尤其是同一個系統中存在多種編碼的情況。由於每種編碼表示的字符範圍有限,所以轉碼過程中有可能丟失字符信息。因此,如果你的程序着眼於全球市場,而不僅僅侷限於中文用戶,或者未來發展有這方面的需求,那麼就應該堅持程序內部都使用同一種Unicode編碼,如UTF-8,這樣以後程序在國際化時就不會存在什麼編碼問題。
來源: http://news.csdn.net/n/20080509/115815.html

http://blog.cathayan.org/item/1765
http://hedong.3322.org/archives/000355.html
發佈了0 篇原創文章 · 獲贊 0 · 訪問量 8944
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章