python3編碼

原創

weixin_40634253

2019-09-05 13:53

編碼方式：

ascii：英文：8位一個字節

unicode：英文：32位四個字節

中文：32位四個字節

utf-8：英文：8位一個字節

中文：24位三個字節

gbk：英文：8位一個字節

中文：16位兩個字節（包含大多數漢字）

注意：1：各個編碼之間的二進制，是不能互相識別的，會產生亂碼

2：文件的儲存，傳世，不能是unicode（只能是utf-8，utf-16，gbk，gb2312，ascii等）

str在內存中使用unicode編碼

英文： str ：表現形式：s = 'zzz'

編碼方式： 010101010（假設） unicode

bytes：表現形式：s = b'zzz'

編碼方式： 000101010 utf-8 gbk。。。

中文： str ：表現形式：s = '中國'

編碼方式： 010101010 unicode

bytes：表現形式：s = b'\e91\e91\e01\e21\e31\e32'

編碼方式： 000101010 utf-8 gbk。。。

encode解碼：str-->bytes

s = 'zzz'

s1 = s.encode('utf-8')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

快速搞懂.NET 5/.NET Core應用程序的發佈部署快速搞懂.NET 5/.NET Core應用程序的發佈部署

摘自：https://www.cnblogs.com/tianqing/p/14403255.html 快速搞懂.NET 5/.NET Core應用程序的發佈部署 .NET Framework時代，.NET 應用程序大多直接部署運行

Sam Xiao

2021-03-22 18:35:21

字符編碼格式歷史

原文地址：http://blog.csdn.net/iscandy/archive/2009/02/02/3859219.aspx 很久很久以前，有一羣人，他們決定用8個可以開合的晶體管來組合成不同的狀態，以表示世界上的萬物。他們看到

wangqiang624731186

2020-07-08 02:53:25

Python: Base64文件編碼、解碼

base64.py 模型提供了將二進制數據編碼爲可印刷的 ASCII 字符和將這些編碼後的數據返回到二進制數據的方法。一、方法 b64encode(s, altchars=None) 1. 使用 Base64 編碼類字節對象（bytes

Ambitioner_c

2020-07-08 02:30:58

字符與GBXX,UCS-2,utf-8編碼的相互轉換

在介紹轉換之前，先介紹一下常見的字符集： 1ASCII:這個大家應該都比較熟悉，他把英文字母、數字等256個字符編碼爲Ox00-OxFF 2GBXX:包括GB2312、GBK、GB18030，這裏面主要增加了對漢及漢字標點等的編碼。其中G

向日葵之热爱生命

2020-07-07 23:38:21

FPGA學習筆記---二進制碼、獨熱碼、格雷碼分析對比

在Verilog學習中常用的編碼方式有二進制編碼(Binary)、格雷碼(Gray-code)編碼、獨熱碼(One-hot)編碼，對於新手來說，搞不清楚編碼爲什麼要分這麼多格式？統一用一種格式不好嗎？那麼現在就來看看這三種編

qq_511386807

2020-07-07 11:27:29

解決SyntaxError: Non-ASCII character ‘\xe5′ in file

問題：編寫Python時，嘗試使用中文字符出現： SyntaxError: Non-ASCII character ‘\xe5′ in file 原因是Python的默認編碼文件是用的ASCII碼，文件中使用了中文等非英語字符。

Hades_Dev

2020-07-06 23:51:42

maven項目中程序運行編譯的時候出現：編碼GBK的不可映射字符

由於JDK是國際版的，我們在用javac.exe編譯時，編譯程序首先會獲得我們操作系統默認採用的編碼格式（也即在編譯java程序時，若我們不指定源程序文件的編碼格式，JDK首先獲得操作系統的file.encoding參數(它保存的

学渣之路

2020-07-06 17:54:09

【目標檢測】UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 4886: invalid start byte

Q：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 4886: invalid start byte 在Vim中可以直接查看文件編碼 :set fi

Mein_Augenstern

2020-07-06 09:16:29

jpeg編碼學習筆記

jpeg編碼學習筆記各種圖片格式目的是在網絡傳輸和存儲的時候使用更少的字節，即起到壓縮的作用。在圖片格式解碼後，無論圖片的格式，圖片數據都是像素數組。本文將嘗試通過JPEG這種圖片編碼格式的學習，瞭解圖片編碼的祕密。 JP

Felixabcd

2020-07-05 21:37:37

爬蟲返回數據 16進制編碼問題

昨天分析爬蟲接口時發現返回數據 json轉化時出錯經過檢查發現問題是 json字符串中有 \x3E、\x2F這種編碼字符串，開始解決思路就是把16進制轉化爲普通字符串結果不行原因編碼問題本來這些返回數據是需要

写Bug 的大潘

2020-07-05 19:56:48

C#生成ANSI編碼格式的文件

VS代碼中的Encoding.ASCII並不是ANSI編碼的意思；使用GB2312 以代表ANSI編碼 string fileName = "D:\\1234.txt"; StreamWriter sw = new StreamWri

谷凯Jump

2020-07-05 17:59:50

編碼問題之轉碼

這幾天遇到編碼問題，初步整理一下。計算機中有好多編碼，編碼問題也是因爲文字的編碼不統一，編碼間的差異造成的。所謂亂碼，其實就是因爲字符使用的編碼，解碼的類型不一樣，纔出現的一些不認識或者不是想要的數據。比如：用UTF-8編碼的【中國

东东东雷

2020-07-05 16:01:30

Java的字符表示格式

Java的字符表示格式是什麼？ JVM的設計者當初決定JVM中所有字符的表示形式時，是不允許使用各種編碼方式的字符並存的。原因：如果內存中的Java字符可以以GB2312、UTF-16、BIG5等各種編碼存在，那麼對於開發者來說，連最基

南山饱虎

2020-07-05 15:38:53

linux 下文本文件的編碼格式轉換

主要工具enca，沒有的話需要安裝enca -L zh_CN filename 可以查看文件的編碼格式，如果需要轉換的話，則enca -L zh_CN -x utf-8 filename 或 utf-8是目標編碼格式，這個命令會覆蓋原來

mlnotes

2020-07-05 15:00:55

第10章無監督學習（2）

Continue Representational Power, Layer Size and Depth 大多數自編碼器都只有一層所謂的隱藏層，也就是所謂的碼單層已能夠在給定精度表達任何函數 e.g. Principa

亦余心之所向兮

2020-07-05 08:53:47

24小時熱門文章

python3編碼

python集合雜記

列表雜記

python遞歸實現二分查找

python函數雜記01

python文件操作雜記

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結