字節 字符

    字節(Byte):字節是通過網絡傳輸信息(或在硬盤或內存中存儲信息)的單位。字節是計算機信息技術用於計量存儲容量和傳輸容量的一種計量單位,1個字節等於8位二進制,它是一個8位的二進制數,是一個很具體的存儲空間

    

     字符:人們使用的記號,抽象意義上的一個符號。 '1' '' 'a' '$' '' ……


     談到字符就不得不提ANSIUNICODE兩種不同的編碼方式標準,ANSI中的字符采用8bit,而UNICODE中的字符采用16bit。(對於字符來說ANSI以單字節存放英文字符,以雙字節存放中文等字符,Unicode下,英文和中文的字符都以雙字節存放Unicode碼也是一種國際標準編碼,採用二個字節編碼,與ANSI碼不兼容。     ANSI規定:一個小於127的字符的意義與原來相同,但兩個大於127的字符連在一起時,就表示一個漢字,前面的一個字節(他稱之爲高字節)從0xA1用到 0xF7,後面一個字節(低字節)從0xA10xFE,這樣我們就可以組合出大約7000多個簡體漢字了。在這些編碼裏,我們還把數學符號、羅馬希臘的字母、日文的假名們都編進去了,連在 ASCII 裏本來就有的數字、標點、字母都統統重新編了兩個字節長的編碼,這就是常說的"全角"字符,而原來在127號以下的那些就叫"半角"字符了 UNICODE 開始,無論是半角的英文字母,還是全角的漢字,它們都是統一的"一個字符"!同時,也都是統一的"兩個字節"


我們可以簡單的記這樣一個結論:按照ANSI編碼標準,標點符號、數字、大小寫字母都佔一個字節,漢字佔2個字節。按照UNICODE標準所有字符都佔2個字節。


由於不同 ANSI 編碼所規定的標準是不相同的,因此,對於一個給定的多字節字符串,我們必須知道它採用的是哪一種編碼規則,才能夠知道它包含了哪些字符。而對於 UNICODE 字符串來說,不管在什麼環境下,它所代表的字符內容總是不變的。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章