編碼方式:
ascii: 英文 :8位 一個字節
unicode: 英文:32位 四個字節
中文:32位 四個字節
utf-8: 英文:8位 一個字節
中文:24位 三個字節
gbk: 英文:8位 一個字節
中文:16位 兩個字節(包含大多數漢字)
注意:1:各個編碼之間的二進制,是不能互相識別的,會產生亂碼
2:文件的儲存,傳世,不能是unicode(只能是utf-8,utf-16,gbk,gb2312,ascii等)
str在內存中使用unicode編碼
英文: str :表現形式:s = 'zzz'
編碼方式: 010101010(假設) unicode
bytes:表現形式:s = b'zzz'
編碼方式: 000101010 utf-8 gbk。。。
中文: str :表現形式:s = '中國'
編碼方式: 010101010 unicode
bytes:表現形式:s = b'\e91\e91\e01\e21\e31\e32'
編碼方式: 000101010 utf-8 gbk。。。
encode解碼:str-->bytes
s = 'zzz'
s1 = s.encode('utf-8')