文件編碼問題

一、python2默認編碼:gbk

gbk和utf-8編碼的轉換關係:需要以unicode爲中介

gbk-->unicode--->utf-8--->unicode-->gbk
str是utf-8,先decode成unicode
str.decode('utf-8').encode('gbk')
str是gbk,也需要先decode成unicode
str.decode('gbk').encode('uft-8')

注意:GBK不能直接轉換成utf-8

二、python3默認編碼:utf-8,但是以unicode存儲。

所以s轉換成gbk需要先decode成unicode.

s.encode('utf-8').decode('utf-8').encode('gb2312')

以上不是太特麼懂
只要記住了,decode就是轉換成unicode,encode就是轉換成指定的編碼。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章