python3編碼

編碼方式:

ascii:                       英文 :8位  一個字節

unicode:                  英文:32位   四個字節

                                  中文:32位   四個字節

utf-8:                       英文:8位  一個字節

                                  中文:24位   三個字節

gbk:                         英文:8位   一個字節

                                  中文:16位   兩個字節(包含大多數漢字)

注意:1:各個編碼之間的二進制,是不能互相識別的,會產生亂碼

           2:文件的儲存,傳世,不能是unicode(只能是utf-8,utf-16,gbk,gb2312,ascii等)

 

str在內存中使用unicode編碼

英文:  str   :表現形式:s = 'zzz'

                       編碼方式: 010101010(假設)  unicode     

           bytes:表現形式:s = b'zzz'

                        編碼方式: 000101010  utf-8 gbk。。。

中文:  str   :表現形式:s = '中國'

                        編碼方式: 010101010  unicode

           bytes:表現形式:s = b'\e91\e91\e01\e21\e31\e32'

                        編碼方式: 000101010  utf-8 gbk。。。

encode解碼:str-->bytes

 s = 'zzz'

 s1 = s.encode('utf-8')

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章