今天在window平臺下,用python讀取一個txt文件出現下面錯誤:
UnicodeDecodeError: 'gbk' codec can't decode bytes in position 199-200: illegal multibyte sequence
錯誤意思:要將字符串解碼爲Unicode,是以gbk編碼的方式去解碼(該字符串變成Unicode)的但是此處通過gbk的方式,卻無法解碼,即文件的解碼方式不對。
解決方法:
先查看自己文件的編碼方式。查看文件的編碼格式:點擊打開鏈接
window下的文件編碼格式爲:ANSI
ANSI又分爲:
GB2312,GBK,GB8030,Big5,Shift_JIS
結果將解碼方式改爲Shift_JIS就可以了。(當然不同文件有不同編碼方式,就有不同的解碼方式)。