漢字的統一與存儲編碼

原創

2020-02-25 13:12

不同的字形，相同的編碼

今天碰巧看了下unicode編碼問題，計算機的世界真是太神奇了。

因爲中日韓等多個地區都有自己漢字的寫法，統計起來漢字個數就非常多了，如果文字採用16位全球文字編碼（UCS-2標準），六萬多個位置估計放漢字都不夠。所以把一些同字異形的漢字統一成相同的編碼，從而節省空間，這是十分有必要的。
其中漢字編碼有個重要的國際標準ISO10646

原則上ISO 10646只對字（Character），而非字形（Glyph）編碼。

也就是說同一個漢字在不同地區會被解析成不同的字形，簡單理解是漢字寫法的差異。

下圖是win10+IE11的截圖，原表格在維基百科上，不同瀏覽器會導致不同結果（所以怎樣才能顯示正常呢？）

參考文二比較詳細的編碼知識介紹

參考

[1] 維基百科：中日韓統一表意文字
[2] 字符集，編碼的含義，UNICODE與UCS（ISO-10646）的區別

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

指針與句柄區別

句柄是指向指針的指針 windows句柄是windows內的一部分內存，該內存動態的記載不同對象的地址，（windows不希望我們直接拿到對象地址，會帶來不安全）當系統啓動時候，應用程序進入內存塊中，但是程序數據在內存塊

2020-07-05 05:30:43

URL轉義字符原理

url轉義字符原理如果表單的action爲list.jsf?act=go&state=5 則提交時通過request.getParameter可以分別取得act和state的值。如果你的本意是act='go&state=5'這

2020-07-05 05:30:43

TCP/IP協議中的三個參數的理解

TCP/IP協議把成千上萬臺電腦定位在一張通訊網上。其中 1. IP地址 2.子網掩碼 3.網關地址以上三個參數可以定位一臺電腦。一.IP地址分爲A.B.C類地址。其中的特殊

2020-07-05 05:30:43

java獲取程序運行時RT打開qq

代碼： import java.io.IOException; public class TestRT { /** * 使用Runtime對象的exec方法，調用外部exe文件。 */

2020-07-05 05:30:43

NTP時間校準

名稱： NTP (NET TIME PROTOCOL) 網絡時間校準協議原理：過程： 1.假設 Device A : 10:00:00 Device B: 11:00:00 A到B的傳輸時延爲1s 2

2020-07-05 05:30:43

使用git方便的傳輸複雜結構文件

使用SCP不能斷點續傳. 使用rsync支持斷點續傳,但沒有git用起來這麼方便. 今天同事介紹了一個使用 git來傳大工程的方式: 設項目在服務器A:PATH1上需要傳到服務器B:PATH2上在服務器B:PATH2上運行 g

疯狂的大山鸡

2020-07-04 18:48:10

gitlab-runne關於GITLAB_CI使用

GITlab CI/CD流程配置什麼是CI/CD流程CI流程配置:0. 服務器配置:1. gitlab-runner配置:1.1 gitlab-runner安裝:1.2 gitlab-runner註冊:1.3 修改runner的配

疯狂的大山鸡

2020-07-04 18:48:10

將md(markdown)文件導出成PDF的簡單辦法

由於工作需要需要吧md文件導出成PDF文件,通過查詢找到了一個簡單的辦法,這裏記錄一下. 找一個在線md編輯器,用於生成md的預覽格式,如:使用csdn就行. 使用chrome的開發者工具查看網頁源碼,找到文章主題部分的代碼:

疯狂的大山鸡

2020-07-04 18:48:10

TCP/IP總略複習

源端口號隨機 1024~5000之間。大於5000的端口號爲其他服務器預留的，Internet上並不常用的服務。以太網是一般PC使用的標準，速度10Mb/s,地址是48bit。環回接口：一般是判斷是否是127.0.0.1，就給環回驅動

2020-07-04 04:29:07

CIDR無類別域間路由

CIDR中文全稱是無分類域間路由選擇，英文全稱是Classless Inter-Domain Routing，在平常，大家多稱之爲無分類編址，它也是構成超網的一種技術實現。CIDR在一定程度上解決了路由表項目過多過大的問題。C

2020-07-03 03:43:54

2019.11.17 學習總結

1、網上看到了趙炯博士的oldlinux的網站，其電子版和《linux0.11內核註釋》是很不錯的書籍，而且還有配套的實驗環境，包括vm虛擬機，bochs虛擬的環境都有的，因此將來需要學習的話，很適合的一本書另外，《Linux內核源代碼

2020-07-02 21:09:25

解決: Mysql安裝時mysqld.exe報`應用程序無法正常啓動(0xc000007b)`的問題

本機環境 Windows10專業版 Mysql5.7.30解壓版 Win10系統Mysql5.7/Mysql8.0解壓版安裝請參考問題描述 mysql5.7.30解壓版安裝, 解壓之後執行初始化命令, 桌面彈出提示"應用程

2020-07-01 05:41:58

有道詞典提示您的網絡暫時不可用或受限,請檢查您的網絡設置

如果瀏覽器可以正常上網的話，很有可能是代理設置搗的鬼。最近是不是使用過翻牆軟件？可以嘗試取消代理。具體操作請參考：怎麼取消IE瀏覽器的代理設置?

2020-06-30 23:45:12

電腦突然無法複製粘貼Ctrl+C和Ctrl+V怎麼回事？

很可能的原因之一是剪貼板被佔用了。比如被有道詞典的劃詞翻譯佔用。如果是這種原因，把有道詞典關閉即可。其它原因請參考鏈接裏的其它情況。參考鏈接： Windows10的複製粘貼功能自動失效，該怎麼解決？

2020-06-30 23:45:12

eclipse越用越喜歡的快捷鍵

Eclipse 常用快捷鍵和使用技巧1.查看快捷鍵定義的地方 Window->Preferences->General->Keys。2.更改啓動頁在AndroidManifest.xml第一個activity標籤項中 android:n

爱学习的羽

2020-06-28 03:51:40

24小時熱門文章

最新文章

最新評論文章