你在學寫程序的時候，有沒有想過，古老年代的計算機程序是怎麼寫出來的？

當年寫程序，不像現在這樣，都是用一種古老的物理設備，叫作“打孔卡（Punched Card）”

用這種設備寫程序，沒法像今天，掏出鍵盤就能打字，而是要先在腦海/紙寫出程序，然後在紙帶/卡片上打洞

這樣，要寫的程序、要處理的數據，就變成一條條紙帶或者一張張卡片，之後再交給當時的計算機去處理

上世紀60年代晚期或70年代初期，Arnold Reinold拍攝的FORTRAN計算程序的穿孔卡照片

人們在特定的位置上打洞或者不打洞，來代表“0”或者“1”。

爲什麼早期的計算機程序要使用打孔卡，而不能像我們現在一樣，用C或者Python這樣的高級語言來寫呢？

因爲計算機或者說CPU本身，並沒有能力理解這些高級語言

即使在2019年的今天，我們使用的現代個人計算機，仍然只能處理所謂的“機器碼”，也就是一連串的“0”和“1”這樣的數字。

我們每天用高級語言的程序，最終是怎麼變成一串串“0”和“1”的？這一串串“0”和“1”又是怎麼在CPU中處理的？

1 在軟硬件接口中，CPU幫我們做的事

CPU(Central Processing Unit，中央處理器)就是計算機的大腦

硬件的角度

一個超大規模集成電路，通過電路實現了加法、乘法乃至各種各樣的處理邏輯。

軟件工程師的角度

一個執行各種計算機指令（Instruction Code）的邏輯機器
這裏的計算機指令，就好比一門CPU能夠聽得懂的語言，即機器語言（Machine Language）

不同的CPU能夠聽懂的語言不太一樣

個人PC用的是Intel的CPU，iPhone用的是ARM的CPU,這兩者能聽懂的語言就不太一樣

類似這樣兩種CPU各自支持的語言，就是兩組不同的計算機指令集(Instruction Set)

這裏面的“Set”，其實就是數學上的集合，代表不同的單詞、語法

如果我們在自己電腦上寫一個程序，然後把這個程序複製一下，裝到自己的手機上，肯定是沒辦法正常運行的，因爲這兩者語言不通

而一臺電腦上的程序，簡單複製一下到另外一臺電腦上，通常就能正常運行，因爲這兩臺CPU有着相同的指令集，它們語言相通

存儲程序型計算機（Stored-program Computer）

計算機程序，不可能只有一條指令，而是成千上萬條指令組成

但CPU不能一直放着所有指令，所以程序平時是存儲在存儲器

這種程序指令存儲在存儲器裏面的計算機，我們就叫作

Plugboard Computer

在沒有現代計算機之前，有着聰明才智的工程師們，早就發明了一種叫Plugboard Computer的計算設備

在一個佈滿了各種插口和插座的板子上，工程師們用不同的電線來連接不同的插口和插座，從而來完成各種計算任務

IBM的Plugboard

2 編譯=>彙編代碼=>機器碼

代碼，到底是怎麼變成一條條計算機指令，最後被CPU執行的呢？

test.c

編譯（Compile）成彙編代碼
要讓這段程序在Linux跑起來，需要把整個程序翻譯成彙編語言（ASM，Assembly Language）的程序

針對彙編代碼，可以再用匯編器（Assembler）翻譯成機器碼（Machine Code）

這些機器碼由“0”和“1”組成的機器語言表示,這一條條機器碼，就是一條條的計算機指令

這樣一串串的16進制數字，就是我們CPU能夠真正認識的計算機指令。

在Linux上，可使用gcc和objdump，把對應的彙編代碼和機器碼都打印出來。

左側一堆數字，就是一條條機器碼

右邊一系列的push、mov、add、pop等，這些就是對應的彙編代碼

一行C語言代碼，有時候只對應一條機器碼和彙編代碼，有時候則是對應兩條機器碼和彙編代碼

彙編代碼和機器碼之間是一一對應的。

實際在用GCC（GUC編譯器套裝，GUI Compiler Collectipon）編譯器的時候，可直接把代碼編譯成機器碼，爲什麼還需要彙編代碼呢？

那一串數字表示的機器碼，摸不着頭腦

但即使你沒有學過彙編代碼，看的時候多少也能“猜”出一些這些代碼的含義。

彙編代碼就是“給程序員看的機器碼”

也正因爲這樣，機器碼和彙編代碼是一一對應的

很容易記住add、mov這些用英文表示的指令

而8b 45 f8這樣的指令，由於很難一下子看明白是在幹什麼，所以會非常難以記憶

從高級語言到彙編代碼，再到機器碼，就是一個日常開發程序，最終變成了CPU可以執行的計算機指令的過程。

3 解析指令和機器碼

瞭解了這個過程，下面我們放大局部，來看看這一行行的彙編代碼和機器指令，到底是什麼意思。

Intel CPU，有2000條左右的CPU指令，實在是太多了，沒法一一講解。不過一般來說，常見的指令可以分成五大類。

算術類指令

加減乘除，在CPU層面，都會變成一條條算術類指令

數據傳輸類指令

給變量賦值、在內存裏讀寫數據，用的都是數據傳輸類指令。

邏輯類指令

邏輯上的與或非

條件分支類指令

日常的“if/else”

無條件跳轉指令

寫一些大一點的程序，我們常常需要寫一些函數或者方法

在調用函數的時候，其實就是發起了一個無條件跳轉指令。

彙編器是怎麼把對應的彙編代碼，翻譯成爲機器碼的。

不同的CPU有不同的指令集，也就對應着不同的彙編語言和不同的機器碼

爲了方便你快速理解這個機器碼的計算方式，我們選用最簡單的MIPS指令集，來看看機器碼是如何生成的。

MIPS是一組由MIPS技術公司在80年代中期設計出來的CPU指令集。就在最近，MIPS公司把整個指令集和芯片架構都完全開源了。想要深入研究CPU和指令集的同學，推薦一些資料，可以自己瞭解下。

MIPS的指令是一個32位的整數，高6位叫操作碼（Opcode）

也就是代表這條指令具體是一條什麼樣的指令，剩下的26位有三種格式，分別是R、I和J。

R指令

一般用來做算術和邏輯操作，裏面有讀取和寫入數據的寄存器的地址

如果是邏輯位移操作，後面還有位移操作的位移量

而最後的功能碼，則是在前面的操作碼不夠的時候，擴展操作碼錶示對應的具體指令的。

I指令

通常是用在數據傳輸、條件分支，以及在運算的時候使用的並非變量還是常數的時候

這個時候，沒有了位移量和操作碼，也沒有了第三個寄存器，而是把這三部分直接合併成了一個地址值或者一個常數。

J指令

一個跳轉指令，高6位之外的26位都是一個跳轉後的地址

add $t0,$s2,$s1

下面都用十進制來表示對應的代碼。

對應的MIPS指令裏

opcode是0
rs代表第一個寄存器s1的地址是17
rt代表第二個寄存器s2的地址是18
rd代表目標的臨時寄存器t0的地址是8
因爲不是位移操作，所以位移量是0

把這些數字拼在一起，就變成了一個MIPS的加法指令。

爲了讀起來方便，我們一般把對應的二進制數，用16進制表示出來

在這裏，也就是0X02324020。這個數字也就是這條指令對應的機器碼。

回到開頭我們說的打孔帶

打孔代表1
沒有打孔代表0
用4行8列代表一條指令來打一個穿孔紙帶，那麼這條命令大概就長這樣：

你應該學會了怎麼作爲人肉編譯和彙編器，給紙帶打孔編程了，不用再對那些用過打孔卡的前輩們頂禮膜拜了。

4 總結

打孔卡，其實就是一種存儲程序型計算機。

只是這整個程序的機器碼，不是通過計算機編譯出來的，而是由程序員的人腦“編譯”成一張張卡片的

對應的程序，也不是存儲在設備裏，而是存儲成一張打好孔的卡片

但是整個程序運行的邏輯和其他CPU的機器語言沒有什麼分別，也是處理一串“0”和“1”組成的機器碼而已。

我們看到了一個C語言程序，是怎麼被編譯成爲彙編語言，乃至通過彙編器再翻譯成機器碼的。

除了C這樣的編譯型的語言之外，不管是Python這樣的解釋型語言，還是Java這樣使用虛擬機的語言，其實最終都是由不同形式的程序，把我們寫好的代碼，轉換成CPU能夠理解的機器碼來執行的。

只是解釋型語言，是通過解釋器在程序運行的時候逐句翻譯，而Java這樣使用虛擬機的語言，則是由虛擬機對編譯出來的中間代碼進行解釋，或者即時編譯成爲機器碼來最終執行。

5 推薦閱讀

瞭解Intel CPU的指令集參看

《計算機組成與設計：軟/硬件接口》第5版的2.17小節

參考

深入淺出計算機組成原理

重學計算機組成原理（四）- 玩玩紙帶編程

1 在軟硬件接口中，CPU幫我們做的事

2 編譯=>彙編代碼=>機器碼

3 解析指令和機器碼

算術類指令

數據傳輸類指令

邏輯類指令

條件分支類指令

無條件跳轉指令

4 總結

5 推薦閱讀

參考

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

WinForm應用實戰開發指南 - 表格數據錄入問題解析

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

Docker容器實戰(一) - 封神Server端技術

Java高性能編程實戰 - 線程終止

Kafka實戰(五) - Kafka的祕技"阪本"之爭

Kafka實戰(四) -Kafka門派知多少

Dubbo實戰(一) - 入門

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

重學計算機組成原理（四）- 玩玩紙帶編程

1 在軟硬件接口中，CPU幫我們做的事

2 編譯=>彙編 代碼=>機器碼

3 解析指令和機器碼

算術類指令

數據傳輸類指令

邏輯類指令

條件分支類指令

無條件跳轉指令

4 總結

5 推薦閱讀

參考

2 編譯=>彙編代碼=>機器碼