顧名思義:
所謂Base64,就是說選出64個字符——小寫字母a-z、大寫字母A-Z、數字0-9、符號“+”、“/”(再加上作爲墊字的“=”,實際上是65個字符)——作爲一個基本字符集。然後,其他所有符號都轉換成這個字符集中的字符。
意義:
1.由於某些系統中只能使用ASCII字符。Base64就是用來將非ASCII字符的數據轉換成ASCII字符的一種方法。而且base64特別適合在http,mime協議下快速傳輸數據。
2.簡單的加密功能。base64其實不是安全領域下的加密解密算法。雖然有時候經常看到所謂的base64加密解密。其實base64只能算是一個編碼算法,對數據內容進行編碼來適合傳輸。雖然base64編碼過後原文也變成不能看到的字符格式,但是這種方式很初級,很簡單。
規則:
- 第一步,將每三個字節作爲一組,一共是24個二進制位。
- 第二步,將這24個二進制位分爲四組,每個組有6個二進制位。
- 第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節。
- 第四步,根據下表,得到擴展後的每個字節的對應符號,這就是Base64的編碼值。
舉一個具體的實例,演示英語單詞Man如何轉成Base64編碼。
Text content | M | a | n | |||||||||||||||||||||
ASCII | 77 | 97 | 110 | |||||||||||||||||||||
Bit pattern | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 0 |
Index | 19 | 22 | 5 | 46 | ||||||||||||||||||||
Base64-Encoded | T | W | F | u |
第二步,將這個24位的二進制字符串分成4組,每組6個二進制位:010011、010110、000101、101110。
第三步,在每組前面加兩個00,擴展成32個二進制位,即四個字節:00010011、00010110、00000101、00101110。它們的十進制值分別是19、22、5、46。
第四步,根據上表,得到每個值對應Base64編碼,即T、W、F、u。
如果字節數不足三,則這樣處理:
a)二個字節的情況:將這二個字節的一共16個二進制位,按照上面的規則,轉成三組,最後一組除了前面加兩個0以外,後面也要加兩個0。這樣得到一個三位的Base64編碼,再在末尾補上一個“=”號。
比如,“Ma”這個字符串是兩個字節,可以轉化成三組00010011、00010110、00010000以後,對應Base64值分別爲T、W、E,再補上一個“=”號,因此“Ma”的Base64編碼就是TWE=。
b)一個字節的情況:將這一個字節的8個二進制位,按照上面的規則轉成二組,最後一組除了前面加二個0以外,後面再加4個0。這樣得到一個二位的Base64編碼,再在末尾補上兩個“=”號。
比如,“M”這個字母是一個字節,可以轉化爲二組00010011、00010000,對應的Base64值分別爲T、Q,再補上二個“=”號,因此“M”的Base64編碼就是TQ==。
轉換表:
索引 | 對應字符 | 索引 | 對應字符 | 索引 | 對應字符 | 索引 | 對應字符 |
0 | A | 17 | R | 34 | i | 51 | z |
1 | B | 18 | S | 35 | j | 52 | 0 |
2 | C | 19 | T | 36 | k | 53 | 1 |
3 | D | 20 | U | 37 | l | 54 | 2 |
4 | E | 21 | V | 38 | m | 55 | 3 |
5 | F | 22 | W | 39 | n | 56 | 4 |
6 | G | 23 | X | 40 | o | 57 | 5 |
7 | H | 24 | Y | 41 | p | 58 | 6 |
8 | I | 25 | Z | 42 | q | 59 | 7 |
9 | J | 26 | a | 43 | r | 60 | 8 |
10 | K | 27 | b | 44 | s | 61 | 9 |
11 | L | 28 | c | 45 | t | 62 | + |
12 | M | 29 | d | 46 | u | 63 | / |
13 | N | 30 | e | 47 | v | | |
14 | O | 31 | f | 48 | w | | |
15 | P | 32 | g | 49 | x | | |
16 | Q | 33 | h | 50 | y | | |