Base64編碼

顧名思義:

所謂Base64,就是說選出64個字符——小寫字母a-z、大寫字母A-Z、數字0-9、符號“+”、“/”(再加上作爲墊字的“=”,實際上是65個字符)——作爲一個基本字符集。然後,其他所有符號都轉換成這個字符集中的字符。



意義:

1.由於某些系統中只能使用ASCII字符。Base64就是用來將非ASCII字符的數據轉換成ASCII字符的一種方法。而且base64特別適合在http,mime協議下快速傳輸數據。

2.簡單的加密功能。base64其實不是安全領域下的加密解密算法。雖然有時候經常看到所謂的base64加密解密。其實base64只能算是一個編碼算法,對數據內容進行編碼來適合傳輸。雖然base64編碼過後原文也變成不能看到的字符格式,但是這種方式很初級,很簡單。

 

規則:

 

  • 第一步,將每三個字節作爲一組,一共是24個二進制位。
  • 第二步,將這24個二進制位分爲四組,每個組有6個二進制位。
  • 第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節。
  • 第四步,根據下表,得到擴展後的每個字節的對應符號,這就是Base64的編碼值。

 

 

舉一個具體的實例,演示英語單詞Man如何轉成Base64編碼。

 

Text content M a n
ASCII 77 97 110
Bit pattern 0 1 0 0 1 1 0 1 0 1 1 0 0 0 0 1 0 1 1 0 1 1 1 0
Index 19 22 5 46
Base64-Encoded T W F u

 

 

 

 

 

解釋
第一步,“M”、“a”、“n”的ASCII值分別是77、97、110,對應的二進制值是01001101、01100001、01101110,將它們連成一個24位的二進制字符串010011010110000101101110。
第二步,將這個24位的二進制字符串分成4組,每組6個二進制位:010011、010110、000101、101110。
第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節:00010011、00010110、00000101、00101110。它們的十進制值分別是19、22、5、46。
第四步,根據上表,得到每個值對應Base64編碼,即T、W、F、u。

 

 

如果字節數不足三,則這樣處理:

a)二個字節的情況:將這二個字節的一共16個二進制位,按照上面的規則,轉成三組,最後一組除了前面加兩個0以外,後面也要加兩個0。這樣得到一個三位的Base64編碼,再在末尾補上一個“=”號。

比如,“Ma”這個字符串是兩個字節,可以轉化成三組00010011、00010110、00010000以後,對應Base64值分別爲T、W、E,再補上一個“=”號,因此“Ma”的Base64編碼就是TWE=。

b)一個字節的情況:將這一個字節的8個二進制位,按照上面的規則轉成二組,最後一組除了前面加二個0以外,後面再加4個0。這樣得到一個二位的Base64編碼,再在末尾補上兩個“=”號。

比如,“M”這個字母是一個字節,可以轉化爲二組00010011、00010000,對應的Base64值分別爲T、Q,再補上二個“=”號,因此“M”的Base64編碼就是TQ==。

轉換表:

 

索引 對應字符 索引 對應字符 索引 對應字符 索引 對應字符
0 A 17 R 34 i 51 z
1 B 18 S 35 j 52 0
2 C 19 T 36 k 53 1
3 D 20 U 37 l 54 2
4 E 21 V 38 m 55 3
5 F 22 W 39 n 56 4
6 G 23 X 40 o 57 5
7 H 24 Y 41 p 58 6
8 I 25 Z 42 q 59 7
9 J 26 a 43 r 60 8
10 K 27 b 44 s 61 9
11 L 28 c 45 t 62 +
12 M 29 d 46 u 63 /
13 N 30 e 47 v
14 O 31 f 48 w
15 P 32 g 49 x
16 Q 33 h 50 y
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章