一文帶你最簡單易懂的瞭解區塊鏈原理

區塊鏈（blockchain）是眼下的大熱門，新聞媒體大量報道，宣稱它將創造未來。

可是，簡單易懂的入門文章卻很少。區塊鏈到底是什麼，有何特別之處，很少有解釋。

下面，我就來嘗試，寫一篇最好懂的區塊鏈教程。畢竟它也不是很難的東西，核心概念非常簡單，幾句話就能說清楚。我希望讀完本文，你不僅可以理解區塊鏈，還會明白什麼是挖礦、爲什麼挖礦越來越難等問題。

需要說明的是，我並非這方面的專家。雖然很早就關注，但是仔細地瞭解區塊鏈，還是從今年初開始。文中的錯誤和不準確的地方，歡迎大家指正。

一、區塊鏈的本質

區塊鏈是什麼？一句話，它是一種特殊的分佈式數據庫。

首先，區塊鏈的主要作用是儲存信息。任何需要保存的信息，都可以寫入區塊鏈，也可以從裏面讀取，所以它是數據庫。

其次，任何人都可以架設服務器，加入區塊鏈網絡，成爲一個節點。區塊鏈的世界裏面，沒有中心節點，每個節點都是平等的，都保存着整個數據庫。你可以向任何一個節點，寫入/讀取數據，因爲所有節點最後都會同步，保證區塊鏈一致。

二、區塊鏈的最大特點

分佈式數據庫並非新發明，市場上早有此類產品。但是，區塊鏈有一個革命性特點。

區塊鏈沒有管理員，它是徹底無中心的。其他的數據庫都有管理員，但是區塊鏈沒有。如果有人想對區塊鏈添加審覈，也實現不了，因爲它的設計目標就是防止出現居於中心地位的管理當局。

正是因爲無法管理，區塊鏈才能做到無法被控制。否則一旦大公司大集團控制了管理權，他們就會控制整個平臺，其他使用者就都必須聽命於他們了。

但是，沒有了管理員，人人都可以往裏面寫入數據，怎麼才能保證數據是可信的呢？被壞人改了怎麼辦？請接着往下讀，這就是區塊鏈奇妙的地方。

三、區塊

區塊鏈由一個個區塊（block）組成。區塊很像數據庫的記錄，每次寫入數據，就是創建一個區塊。

每個區塊包含兩個部分。

區塊頭（Head）：記錄當前區塊的特徵值

區塊體（Body）：實際數據

區塊頭包含了當前區塊的多項特徵值。

生成時間

實際數據（即區塊體）的哈希

上一個區塊的哈希

...

這裏，你需要理解什麼叫哈希（hash），這是理解區塊鏈必需的。

所謂"哈希"就是計算機可以對任意內容，計算出一個長度相同的特徵值。區塊鏈的哈希長度是256位，這就是說，不管原始內容是什麼，最後都會計算出一個256位的二進制數字。而且可以保證，只要原始內容不同，對應的哈希一定是不同的。

舉例來說，字符串123的哈希是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0（十六進制），轉成二進制就是256位，而且只有123能得到這個哈希。（理論上，其他字符串也有可能得到這個哈希，但是概率極低，可以近似認爲不可能發生。）

因此，就有兩個重要的推論。

推論1：每個區塊的哈希都是不一樣的，可以通過哈希標識區塊。

推論2：如果區塊的內容變了，它的哈希一定會改變。

四、 Hash 的不可修改性

區塊與哈希是一一對應的，每個區塊的哈希都是針對"區塊頭"（Head）計算的。也就是說，把區塊頭的各項特徵值，按照順序連接在一起，組成一個很長的字符串，再對這個字符串計算哈希。

Hash = SHA256( 區塊頭 )

上面就是區塊哈希的計算公式，SHA256是區塊鏈的哈希算法。注意，這個公式裏面只包含區塊頭，不包含區塊體，也就是說，哈希由區塊頭唯一決定，

前面說過，區塊頭包含很多內容，其中有當前區塊體的哈希，還有上一個區塊的哈希。這意味着，如果當前區塊體的內容變了，或者上一個區塊的哈希變了，一定會引起當前區塊的哈希改變。

這一點對區塊鏈有重大意義。如果有人修改了一個區塊，該區塊的哈希就變了。爲了讓後面的區塊還能連到它（因爲下一個區塊包含上一個區塊的哈希），該人必須依次修改後面所有的區塊，否則被改掉的區塊就脫離區塊鏈了。由於後面要提到的原因，哈希的計算很耗時，短時間內修改多個區塊幾乎不可能發生，除非有人掌握了全網51%以上的計算能力。

正是通過這種聯動機制，區塊鏈保證了自身的可靠性，數據一旦寫入，就無法被篡改。這就像歷史一樣，發生了就是發生了，從此再無法改變。

每個區塊都連着上一個區塊，這也是"區塊鏈"這個名字的由來。

五、採礦

由於必須保證節點之間的同步，所以新區塊的添加速度不能太快。試想一下，你剛剛同步了一個區塊，準備基於它生成下一個區塊，但這時別的節點又有新區塊生成，你不得不放棄做了一半的計算，再次去同步。因爲每個區塊的後面，只能跟着一個區塊，你永遠只能在最新區塊的後面，生成下一個區塊。所以，你別無選擇，一聽到信號，就必須立刻同步。

所以，區塊鏈的發明者中本聰（這是假名，真實身份至今未知）故意讓添加新區塊，變得很困難。他的設計是，平均每10分鐘，全網才能生成一個新區塊，一小時也就六個。

這種產出速度不是通過命令達成的，而是故意設置了海量的計算。也就是說，只有通過極其大量的計算，才能得到當前區塊的有效哈希，從而把新區塊添加到區塊鏈。由於計算量太大，所以快不起來。

這個過程就叫做採礦（mining），因爲計算有效哈希的難度，好比在全世界的沙子裏面，找到一粒符合條件的沙子。計算哈希的機器就叫做礦機，操作礦機的人就叫做礦工。

六、難度係數

讀到這裏，你可能會有一個疑問，人們都說採礦很難，可是採礦不就是用計算機算出一個哈希嗎，這正是計算機的強項啊，怎麼會變得很難，遲遲算不出來呢？

原來不是任意一個哈希都可以，只有滿足條件的哈希纔會被區塊鏈接受。這個條件特別苛刻，使得絕大部分哈希都不滿足要求，必須重算。

原來，區塊頭包含一個難度係數（difficulty），這個值決定了計算哈希的難度。舉例來說，第100000個區塊的難度係數是 14484.16236122。

區塊鏈協議規定，使用一個常量除以難度係數，可以得到目標值（target）。顯然，難度係數越大，目標值就越小。

哈希的有效性跟目標值密切相關，只有小於目標值的哈希纔是有效的，否則哈希無效，必須重算。由於目標值非常小，哈希小於該值的機會極其渺茫，可能計算10億次，纔算中一次。這就是採礦如此之慢的根本原因。

前面說過，當前區塊的哈希由區塊頭唯一決定。如果要對同一個區塊反覆計算哈希，就意味着，區塊頭必須不停地變化，否則不可能算出不一樣的哈希。區塊頭裏面所有的特徵值都是固定的，爲了讓區塊頭產生變化，中本聰故意增加了一個隨機項，叫做 Nonce。

Nonce 是一個隨機值，礦工的作用其實就是猜出 Nonce 的值，使得區塊頭的哈希可以小於目標值，從而能夠寫入區塊鏈。Nonce 是非常難猜的，目前只能通過窮舉法一個個試錯。根據協議，Nonce 是一個32位的二進制值，即最大可以到21.47億。第 100000 個區塊的 Nonce 值是274148111，可以理解成，礦工從0開始，一直計算了 2.74 億次，纔得到了一個有效的 Nonce 值，使得算出的哈希能夠滿足條件。

運氣好的話，也許一會就找到了 Nonce。運氣不好的話，可能算完了21.47億次，都沒有發現 Nonce，即當前區塊體不可能算出滿足條件的哈希。這時，協議允許礦工改變區塊體，開始新的計算。

七、難度係數的動態調節

正如上一節所說，採礦具有隨機性，沒法保證正好十分鐘產出一個區塊，有時一分鐘就算出來了，有時幾個小時可能也沒結果。總體來看，隨着硬件設備的提升，以及礦機的數量增長，計算速度一定會越來越快。

爲了將產出速率恆定在十分鐘，中本聰還設計了難度係數的動態調節機制。他規定，難度係數每兩週（2016個區塊）調整一次。如果這兩週裏面，區塊的平均生成速度是9分鐘，就意味着比法定速度快了10%，因此接下來的難度係數就要調高10%；如果平均生成速度是11分鐘，就意味着比法定速度慢了10%，因此接下來的難度係數就要調低10%。

難度係數越調越高（目標值越來越小），導致了採礦越來越難。

八、區塊鏈的分叉

即使區塊鏈是可靠的，現在還有一個問題沒有解決：如果兩個人同時向區塊鏈寫入數據，也就是說，同時有兩個區塊加入，因爲它們都連着前一個區塊，就形成了分叉。這時應該採納哪一個區塊呢？

現在的規則是，新節點總是採用最長的那條區塊鏈。如果區塊鏈有分叉，將看哪個分支在分叉點後面，先達到6個新區塊（稱爲"六次確認"）。按照10分鐘一個區塊計算，一小時就可以確認。

由於新區塊的生成速度由計算能力決定，所以這條規則就是說，擁有大多數計算能力的那條分支，就是正宗的區塊鏈。

九、區塊鏈分類

以參與方分類，區塊鏈可以分爲公有鏈、聯盟鏈和私有鏈；從鏈與鏈的關係來分，可以分爲主鏈和側鏈。

1) 公有鏈（Public Blockchain）

公有鏈通常也稱爲非許可鏈（Permissionless Blockchain），無官方組織及管理機構，無中心服務器，參與的借點按照系統規格自由接入網路、不受控制，節點間基於共識機制開展工作。

公有鏈是真正意義上的完全去中心化的區塊鏈，它通過密碼學保證交易不可篡，同時也利用密碼學驗證以及經濟上的激勵，在互爲陌生的網絡環境中建立共識，從而形成去中心化的信用機制。在公有鏈中的共識機制一般是工作量證明（PoW）或權益證明（PoS），用戶對共識形成的影響力直接取決於他們在網絡中擁有資源的佔比。

公有鏈一般適合於虛擬貨幣、面向大衆的電子商務、互聯網金融等B2C、C2C或C2B等應用場景，比特幣和以太坊等就是典型的公有鏈。

2) 聯盟鏈（Consortium Blockchain）

聯盟鏈是一種需要註冊許可的區塊鏈，這種區塊鏈也稱爲許可鏈（Permissioned Blockchain）。聯盟鏈僅限於聯盟成員參與，區塊鏈上的讀寫權限、參與記賬權限按聯盟規則來制定。整個網絡由成員機構共同維護，網絡接入一般通過成員機構的網關節點接入，共識過程由預先選好的節點控制。由於參與共識的節點比較少，聯盟鏈一般不採用工作量證明的挖礦機制，而是多采用權益證明（PoS）或PBFT（Practical Byzantine Fault Tolerant）、RAFT等共識算法。

一般來說，聯盟鏈適合於機構間的交易、結算或清算等B2B場景。例如在銀行間進行支付、結算、清算的系統就可以採用聯盟鏈的形式，將各家銀行的網關節點作爲記賬節點，當網絡上有超過2/3的節點確認一個區塊，該區塊記錄的交易將得到全網確認。聯盟鏈對交易的確認時間、每秒交易數都與公有鏈有較大的區別，對安全和性能的要求也比公共鏈高。

由40多家銀行參與的區塊鏈聯盟R3和Linux基金會支持的超級賬本（Hyperleder）項目都屬於聯盟鏈架構。目前國內有影響力的區塊鏈聯盟——中國分佈式總賬基礎協議聯盟（ChinaLedger）、中國區塊鏈研究聯盟、金鍊盟（金融區塊鏈聯盟）等——也都在致力於開發聯盟區塊鏈項目。

3) 私有鏈（Private Blockchain）

私有鏈建立在某個企業內部，系統的運作規則根據企業要求進行設定。

私有鏈的應用場景一般是企業內部的應用，如數據庫管理、審計等；在政府行業也會有一些應用，比如政府的預算和執行，或者政府的行業統計數據，這個一般來說由政府登記，但公衆有權力監督。私有鏈的價值主要是提供安全、可追溯、不可篡改、自動執行的運算平臺，可以同時防範來自內部和外部對數據的安全攻擊，這個在傳統的系統是很難做到的。

4) 側鏈（Side chain）

側鏈是用於確認來自於其它區塊鏈的數據的區塊鏈，通過雙向掛鉤（TwoWay Peg）機制使比特幣、Ripple幣等多種資產在不同區塊鏈上以一定的匯率實現轉移。

所謂“多種資產在不同區塊鏈上轉移”其實並不會實際發生。以比特幣爲例，側鏈的運作機制是，將比特幣暫時鎖定在比特幣區塊鏈上，同時將輔助區塊鏈上的等值數字貨幣解鎖；當輔助區塊鏈上的數字貨幣被鎖定時，原先的比特幣就被解鎖。

側鏈進一步擴展了區塊鏈技術的應用範圍和創新空間，使區塊鏈支持包括股票、債券、金融衍生品等在內的多種資產類型，以及小微支付、智能合約、安全處理機制、真實世界財產註冊等；側鏈還可以增強區塊鏈的隱私保護。

十、總結

區塊鏈作爲無人管理的分佈式數據庫，從2009年開始已經運行了8年，沒有出現大的問題。這證明它是可行的。

但是，爲了保證數據的可靠性，區塊鏈也有自己的代價。一是效率，數據寫入區塊鏈，最少要等待十分鐘，所有節點都同步數據，則需要更多的時間；二是能耗，區塊的生成需要礦工進行無數無意義的計算，這是非常耗費能源的。

因此，區塊鏈的適用場景，其實非常有限。

不存在所有成員都信任的管理當局

寫入的數據不要求實時使用

挖礦的收益能夠彌補本身的成本

如果無法滿足上述的條件，那麼傳統的數據庫是更好的解決方案。

目前，區塊鏈最大的應用場景（可能也是唯一的應用場景），就是以比特幣爲代表的加密貨幣。

區塊鏈的應用可以滲透到非常多的行業，合同，稅收，財產公示(可以含私隱的公示)，防僞，交易，選舉，信用體系…等等，這些都只是本人想到的，其實也還有更多地方可以去應用，而比特幣(泛指去中心加密數字貨幣)主要應用了財產公示，交易…

十、參考鏈接

http://www.ruanyifeng.com/blog/2017/12/blockchain-tutorial.html

一文帶你最簡單易懂的瞭解區塊鏈原理

一、區塊鏈的本質

二、區塊鏈的最大特點

三、區塊

四、 Hash 的不可修改性

五、採礦

六、難度係數

七、難度係數的動態調節

八、區塊鏈的分叉

九、區塊鏈分類

十、總結

十、參考鏈接

python gdal 安裝使用（Windows， python 3.6.8）

Python語言基礎從入門到精通

Python日誌庫logging總結—史上最詳細

Django外鍵反向查詢和json_dumps直接輸出中文

mysql大翻頁limt 1700,100慢優化方案

Linux系統CentOS虛擬機利用conda搭建python虛擬環境

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結