論文筆記:使用區塊鏈和智能合約打擊深度假冒視頻

image.png

摘要

隨着人工智能(AI)和深度學習技術的興起,近年來虛假數字內容激增。假鏡頭、假圖像、假音頻和假視頻(被稱爲深度假冒,Deepfake)可能是一種危險的現象,有可能改變真相,並通過僞造事實來侵蝕信任。數字媒體的真實性證明(PoA,Proof of authenticity)對於根除僞造內容的流行至關重要。目前的解決方案缺乏提供數字媒體歷史跟蹤和來源的能力。本文提出了一種基於以太坊智能合約的解決方案和總體框架,即使數字內容被多次複製,也能追蹤數字內容到原始來源的發展和歷史。智能合約利用了用於存儲數字內容及其元數據的行星際文件系統(IPFS,Interplanetary file system)的散列。我們的解決方案側重於視頻內容,但本文提供的解決方案框架足夠通用,可以應用於任何其他形式的數字內容。我們的解決方案依賴於這樣一個原則:如果內容可以可靠地追蹤到可信或信譽良好的來源,那麼內容就可以真實可信。智能合約的完整代碼已在Github上公開。

01

引言

 

最近人工智能、深度學習和圖像處理的興起,引領了深度假冒視頻(Deepfake videos)的製作[1],[2],一段短至美國前總統奧巴馬一分鐘的視頻在2018年4月走紅,在視頻中,奧巴馬被看到說了他從未說過的話[3]。深度假視頻是危險的,並且有可能破壞真相,迷惑觀衆和準確的假現實。隨着社交網絡的發展,此類內容的擴散勢不可擋,並可能加劇與錯誤信息和陰謀論有關的問題。在一些早期的例子中,有很多著名的政治家,女演員,喜劇演員,演藝人員把他們的臉弄成了色情視頻。

與傳統的好萊塢式的假冒視頻相比,深度假冒視頻更逼真,更容易製作,而傳統的好萊塢式的假視頻通常是使用像Adobe Photoshop這樣的圖像處理工具手工製作的。Deepfake視頻利用深度學習技術,輸入大樣本視頻圖像,實現人臉交換。樣本數越高,結果就越真實。奧巴馬的視頻被輸入了超過56個小時的樣本錄音,以使其極其真實可信[4]。當第一個視頻以名人爲目標的時候,Deepfake videos在一開始並不是一個大問題。Stover[5]和Floridi[6]將深度假冒視頻描述爲一場數據災難,並呼籲鼓勵公衆充分利用新技術,並在社交媒體上發佈合乎道德和負責任的數字內容。

現有的解決方案可用於證明物理(而非數字)藝術品的真實性。例如,購買藝術品時會提供真品證書(COA,certificate of authenticity)。此外,還可以僞造此證書,或者發現它未經已知的可信機構的簽名。此外,從二級市場購買的藝術品更難證明其來源。目前所尋求的唯一方法是,手動向畫廊或產品來源詢問他們從以前的所有者那裏獲得的COA以及他們的現有客戶[7]–[9]。從某種程度上說,買方需要大量的手工工作和檢查,以獲得準確的藝術品來源。

截至目前,還沒有確定的方法來檢查在線發佈或發佈的數字視頻、音頻或圖像的原創性。把這些數字內容交給COA的想法是不可行的。很難以可信和可信的方式確定發佈的數字項目的真實來源。一個典型的用戶通常使用在線搜索引擎試圖在數字媒體上找到相關的帖子、博客或評論來判斷其真實性。因此,迫切需要一個在線數字內容的真實性證明(PoA)系統來識別可信的發佈源,從而能夠打擊深度僞造的視頻、音頻和圖像。區塊鏈能夠在分散的分佈式分類賬中提供不可變和防篡改的數據和交易[10]

區塊鏈能夠提供關鍵功能,以分散、高度信任和安全的方式證明數字資產的真實性和獨創性。[16] ,[17],具有防篡改記錄、日誌和交易,在無權限區塊鏈的情況下,所有人都可以公開訪問,在有權限區塊鏈的情況下,僅限於特定參與者。對於deepfakes,最適合使用無許可或公共區塊鏈。我們在本文中的解決方案基於公共以太坊區塊鏈和智能合約來管理和捕獲數字內容交易的歷史記錄[18]。

在本文中,我們提出了一個基於區塊鏈的解決方案和一個通用框架,用於證明數字資產(包括視頻、音頻、圖像等)的真實性。我們的解決方案允許公開訪問、可信和可信的數據來源,並跟蹤發佈的在線視頻的歷史記錄。我們的解決方案側重於視頻內容,但本文提供的解決方案框架是通用的,可以應用於任何其他形式的數字內容,如音頻和圖像。我們論文的主要貢獻概括如下:

  1. 我們提出了一個以太坊區塊鏈解決方案,通過提供可信和安全的可追溯性到可信的藝術家或出版來源,建立數字內容的真實性。在整篇論文中,“藝術家”一詞是指數字內容的創造者或出版商。藝術家可以包括自由職業者或受僱的攝影師、狗仔隊、記者、記者等;

  2. 我們提出了以太坊智能合約的系統架構和設計細節,包括實體關係、序列圖和算法,用於控制和管理參與者之間的交互和事務;

  3. 我們在基於區塊鏈的系統設計中集成了行星際文件系統(IPFS)分散存儲[19]和信譽系統、以太坊名稱服務以及其他鏈外資源的關鍵功能,以訪問藝術家的個人資料;

  4. 我們提供完整的實現智能合約代碼1和測試細節;

  5. 我們提供測試細節以顯示正確的系統功能。我們還討論瞭解決方案的成本估算和安全性分析。

 

02

相關研究

 

Li和Lyu[20]提出了一種利用人工智能(AI)檢測深度假冒視頻的方法。建議的方法依賴於一個人工智能算法與另一個人工智能算法。他們的技術依賴於訓練卷積神經網絡(CNN)與操縱和真實的數字。使用四種不同的CNN網絡進行測試,其準確率在84%到99%之間。他們的研究結果看起來很有希望,然而,作者指出了許多有待解決的挑戰。當前獲得的deepfake視頻中存在的問題使得他們的方法給出了積極的結果。因此,他們認爲高分辨率和高質量的深度假視頻很難被發現。

美國一家名爲Truepic[22]的初創公司開發了一個系統,包括典型用戶和自由職業者的移動應用程序,用於捕獲圖像並將其保存到公司的服務器上。保存圖像的目的是保持圖像的完整性。因此,任何僞造的企圖都可以通過與服務器上的圖像進行比較而被發現。他們希望,未來他們的技術將與其他社交媒體合作使用,這些社交媒體將使用Truepic服務器中的圖像驗證任何上傳的圖像,並因此檢測到任何更改。Truepic還使用區塊鏈存儲已保存圖像的元數據,以確保不變性。該方法在很大程度上依賴於對圖像的信任度,並且所有上傳的圖像都是真實的。在圖像或視頻幀中插入logo、文本標記、字幕或封閉式字幕時,不清楚該方法的工作原理。

 

03

基於區塊鏈的POA

 

A. 系統概述和設計

所有參與實體都有以太坊地址

視頻:視頻除了圖1所示的視頻幀之外,還有其他重要信息。視頻密鑰屬性以EXIF(Exchangeable Image File)格式存儲爲“元數據”。視頻的元數據包含與捕獲視頻的設備、捕獲設置、捕獲日期和時間相關的信息,以及視頻創建者可以添加的日誌和手動添加的信息。每段視頻都將與一個以太坊智能合約相關聯,該合約可以由一位藝術家或新聞來源創建。藝術家的以太坊地址和智能合約的地址是元數據的組成部分;

IPFS存儲:視頻及其相關的元數據存儲在一個分散的、內容可尋址的對等文件系統上,如行星際文件系統(IPFS)[19]。IPFS生成一個唯一的散列,它是包含視頻內容及其元數據的文件包的地址。哈希地址用於定位和訪問IPFS網絡上存儲的文件包。此外,IPFS捆綁包可以包括一個文件,其中包含複製和編輯的條款和條件協議,以防視頻被其他作者或藝術家複製以創建不同的內容。從保存的表單生成的IPFS散列也將用於智能合約。

鏈上資源:視頻的IPFS散列被創建後,由以太坊區塊鏈上的原始藝術家(所有者)創建智能合約。合約有屬性和變量來捕獲視頻細節和所有者信息。它還包含一些功能,使其他二級藝術家能夠根據協議表單的條款和條件請求共享、編輯和分發許可。此外,智能合約包含基於角色或合約狀態限制方法訪問的修改器。此外,事件還用於創建通知並記錄重要的結果和請求。變量還用於存儲靜態信息,如視頻相關數據和合約狀態。類似地,任何二級藝術家編輯的視頻都會有自己的智能連接到原始視頻。因此,任何原始視頻的所有編輯視頻都是“子”視頻,並且可以在原始視頻的智能合約列表中使用。因此,希望跟蹤視頻到其來源的用戶可以使用鏈上資源輕鬆做到這一點,例如具有所有子視頻智能合約列表的智能合約以及鏈接到他們父母的購物合約。因此,這些數據以及在分類賬上創建的日誌和通知都是來源數據,用戶可以使用這些數據進行非常透明的跟蹤。

ENS服務:用戶還可以使用以太坊名稱服務(ENS,the Ethereum Name Service)[26],如圖1所示。ENS本質上是一個分佈式名稱註冊系統,用於將藝術家的以太坊地址(20字節的隨機值)與捕獲藝術家真實身份(包括姓名、公司和個人資料)的可讀文本相關聯。這個想法是以分散的方式保存在分佈式賬本上的。

鏈外資源:跟蹤數據的用戶也可以訪問鏈外資源,這是我們建議的解決方案的一部分。視頻的智能合約以太坊地址和所有者的以太坊地址也可以鏈接到鏈外憑證數據庫,如圖1所示。此數據庫包含有關所有者的詳細信息以及指向其ENS配置文件的鏈接。它還將包含其他視頻的詳細資料,視頻所有者,以便提供一個完整的個人資料和藝術作品的藝術家。

分佈式信譽系統:部分下鏈資源是分佈式信譽系統。視頻創作者的檔案鏈接到分散的信譽系統,除了評論評論外,該系統還對藝術家的評價打分[27]。這種系統可以使用智能合約的組合來計算得分,也可以使用IPFS來存儲評論。提供信譽和評論可以向公衆開放,也可以僅限於發表意見的成員。信譽系統變得非常重要,特別是對於未知或新藝術家、自由攝影師或記者。投票者可以給藝術家一個名聲,也可以用技巧來支持這位藝術家。因此,信譽系統可以讓用戶更好地判斷一個用戶,他們的內容是否可信。

image.png

 

B. 追蹤視頻的來源

該方案的主要目的是幫助用戶將多個版本的視頻追溯到其來源,如果一個視頻無法追溯到其原始發佈者,則無法信任該視頻。圖2顯示了用戶如何具有多個系統組件(包括智能合約、IPF、ENS和其他鏈上和鏈下資源)的界面和可訪問性,以建立視頻內容的真實性。前端分佈式應用程序(或用戶DApp)可以由用戶開發以自動化真實性過程,也可以集成在視頻播放器或web瀏覽器中以指示播放或顯示的數字內容的真實性。在圖2中,每個視頻都與指向其父視頻的智能合約相關聯,並且每個父視頻都以分層方式鏈接到其子視頻。如圖所示,可以將智能合約“1”跟蹤到其父智能合約“2”,該父智能合約已鏈接並可跟蹤到智能合約“3”。智能合約“3”指向可追溯到原始智能合約“5”的“4”。這些出處數據是公開的,可通過以太坊賬本獲得。

此外,用戶還可以在以太坊名稱服務中查找視頻藝術家的以太坊地址,以瞭解藝術家的個人資料和信息詳細信息。用戶還可以利用鏈外資源進行概要文件查找。這包括使用視頻元數據中的信息,該元數據在IPFS服務器上可用作JSON對象。此外,用戶還可以通過使用憑證數據庫(該數據庫還可以鏈接到藝術家完成的其他工作)以及基於圖2中所示的IPFS信譽系統的藝術家計算來構建更好的概要文件。

image.png

 

04

實現和測試

 

智能合約編程語言:Solidity

IDE:Remix

A. 實現細節

視頻的所有者(原始藝術家)首先創建一個智能合約,其他藝術家可以根據協議表單的條款和條件請求編輯、更改或分發許可。協議表單保存在IPFS服務器[19]上,其哈希作爲智能合約中的一個屬性可用。

二級藝術家(secondary artist,SA)請求第一個編輯、更改或共享權限。二級藝術家發送的請求也是對協議格式的條款和條件的確認。此請求由原藝術家評估,然後宣佈結果。合約可以同時處理多個任務,並且可以處理同一藝術家的多個不同任務。一旦藝術家得到了他們的請求的批准,他們就會創建一個類似於原始合約的子合約,並更新父合約的信息。然後,二級藝術家要求原始藝術家通過原始視頻的合約證明其新創作的合約。在檢查了新創建的智能合約後,原藝術家批准並授予認證。然後,將成功證明的智能合約作爲子合約添加到原始智能合約中。因此,兩個合約都指向對方,因爲每個合約都將對方的以太坊地址作爲其屬性的一部分。

圖3顯示了智能合約的不同實體之間的關係。首先,原始藝術家的智能合約是使用圖3所示的屬性創建的,例如擁有原始藝術家以太坊地址的所有者,以及基於其被授予或被拒絕權限的狀態而保存視頻詳細信息列表的映射。此外,一個有助於追溯的重要列表是被授予認證的視頻列表,這些視頻被認爲是原始合約的子視頻。

每個合約只爲一個視頻創建。因此,合約和視頻實體之間的1:1關係。每個視頻只鏈接到一個具有一個以太坊地址的藝術家。此外,一個智能合約可以有多個基於成功證明的子合約。因此,原始藝術家智能合約和次要藝術家智能合約之間的1:N關係如圖3所示。最後,IPFS[19]也是一個實體,它與在IPFS服務器上上載每個視頻時創建的任何智能合約都有1:1的關係,其IPFS散列是智能合約中的一個屬性。每個合約的條款和條件協議格式也會上傳到他們的pfs服務器上,其哈希值是爲視頻創建的智能合約中的一個屬性。

image.png

 

圖4顯示了序列圖,它捕獲了原始藝術家、次要藝術家和智能合約之間的交互。智能合約歸原藝術家所有,次藝術家有興趣申請更改、編輯和擁有分發權限。因此,如圖4所示,輔助藝術家調用RequestPermission()函數,這表示他們還閱讀了IPFS文件服務器上可用的條款和條件協議表單[19]。這將創建兩個成功的事件來宣佈藝術家請求的註冊。然後,原始作者會回覆是否授予許可或拒絕許可的結果。根據原始藝術家的結果,發生了三種不同的場景。如圖4備選方案1所示的許可被拒絕,或如備選方案2和3所示的許可被授予。

授予的權限允許代理藝術家創建子智能合約,該合約是主合約在功能名稱和屬性方面的精確副本。子合約應具有父合約的以太坊地址(EA)。然後,第二位藝術家使用原始視頻的智能合約中提供的AttestSC()函數請求進行認證。然後,原始藝術家將檢查新創建的子合約,並按備選方案2所示授予嘗試,或按圖4備選方案3所示拒絕嘗試

 

image.png

 

 

B. 測試和驗證

採用的是比較簡單的用例測試。

 

 

05

評估

 

A. 成本分析

在我們提議的解決方案中,使用以太來支付每筆交易的成本。對於在區塊鏈網絡上執行的每個功能,都有交易和執行氣體(gas)成本。執行成本實際上是在區塊鏈網絡上處理翻譯的功能碼實際執行的成本,包括智能合約中的內部存儲成本以及與狀態的任何操作成本。此外,交易成本還包括與部署合約和將數據發送到區塊鏈網絡相關的其他因素[28]。

Table 1 shows the gas costs of the functions in the

smart contract as well as their price in US Dollars. The

gas price used in Table 1 is the average gas price>11th, 2018 which is 2.8 Gwei according to the ETH Gas

Station [29]

Table 1 shows the gas costs of the functions in the

smart contract as well as their price in US Dollars. The

gas price used in Table 1 is the average gas price>11th, 2018 which is 2.8 Gwei according to the ETH Gas

Station [29]

Table 1 shows the gas costs of the functions in the

smart contract as well as their price in US Dollars. The

gas price used in Table 1 is the average gas price>11th, 2018 which is 2.8 Gwei according to the ETH Gas

Station [29]

表1顯示了智能合約中函數的gas成本以及它們的美元價格。表1中使用的天然氣價格爲2018年11月11日的平均天然氣價格,根據ETH Gas Station[29],該價格爲2.8 Gwei/美元。

表1中的函數要麼由原始藝術家(OA)執行,要麼由代理藝術家(SA)執行,如表的函數調用方列所示。這些功能的總成本是最低的,因爲它們的成本都低於0.1美元,而成本最低的是attests功能。這是因爲在智能合約的變量狀態下,它沒有太大的變化。另一方面,可以看出GrandInsertation函數的成本最高。這也是因爲該函數正在顯著更改智能合約的狀態。在這裏,如果認證被授予,所有的視頻詳細信息都會在原始智能合約中更新。這允許原始智能合約跟蹤子合約的所有視頻。因此,我們的智能合約運營成本與智能合約狀態的變化成正比。

image.png

B. 安全分析

本節簡要分析了我們基於區塊鏈的解決方案如何確保關鍵安全目標,如靈活性、責任性、授權、可用性和不可否認性。我們還討論了我們的解決方案是如何恢復的,以及如何抵禦流行的攻擊,如中間人攻擊(MITM,Man In the Middle)、重放分佈式拒絕服務(DDoS)攻擊

完整性:所有的交易歷史以及可供用戶跟蹤和追蹤視頻到其來源的來源數據都是防篡改的。我們的解決方案確保所有事件和日誌的完整性,包括相關的可追溯性來源數據都存儲在不可變的區塊鏈基礎設施中。此外,視頻的完整性也得到了很好的維護,方法是將其存儲在IPFS分佈式服務器上,並在智能合約中只保存hash。對視頻的任何更改都將導致一個新的哈希值,該哈希值與智能合約中的哈希值不匹配。因此,區塊鏈上的視頻內容是防篡改的,並且是創建者的推測,因爲評論也是基於IPFS的,不能更改。

責任性(Accountability):區塊鏈上調用方執行的智能合約中的每一個函數調用都被追溯到調用方的以太坊地址。因此,每個參與實體都對其在分類賬上的行爲負責。

不可抵否認性:區塊鏈網絡上發生的所有交易都由發起人以加密方式簽名。因此,任何人都不能否認自己的行爲,因爲所有的行爲都保存在防篡改日誌中。

授權:在我們的智能合約代碼中,每個功能只能由某個實體執行。這是使用修飾符完成的,修飾符在函數代碼執行之前放置需求。僅當以太坊地址與授權執行器的以太坊地址匹配時,纔會執行該函數。此外,如果證明是由原始創建者提供的,則解決方案的設計僅允許智能合約追溯到父合約。因此,需要原始創建者的授權才能完成鏈上驗證數據更新。

可用性:參與實體一旦部署到區塊鏈網絡,就可以隨時訪問智能合約。所有的日誌以及鏈上的數據都是可訪問的,並通過分類賬提供給所有人。由於區塊鏈的分散性以及數以萬計的採礦節點的全球佈局和分佈,區塊鏈網絡受到DoS和DDoS攻擊的保護。儲存在分類賬上的信息以分散和分散的方式保存,不受黑客攻擊、危害或是失敗。複製防篡改記錄,並可用於所有挖掘節點。

MITM和重放攻擊:在鏈上執行的每個事務都由每個參與者的私鑰加密簽名。每個事務都有唯一的時間戳和id。因此,如果入侵者試圖篡改內容或以任何方式修改內容,則他們無法在沒有合法私鑰的情況下對其進行簽名,從而導致事務無效並被挖掘節點丟棄。重複的事務也將被挖掘節點丟棄。這使得解決方案能夠防止重播和MITM攻擊。

假冒(Impersonation)和Sybil攻擊:在假冒中,攻擊者僞裝成合法用戶來設置系統授權和訪問。在Sybil攻擊中,攻擊者假設存在許多非法和僞造的身份,目的是在用戶社區中獲得更多的控制和影響。在設計上,區塊鏈通過將每個參與者/藝術家的身份與只有用戶知道的唯一私鑰相關聯來防止這兩種攻擊。在我們的提議系統中,ENS服務(這是一個分散的基於以太網的命名和註冊服務)有一個所有身份的記錄,所有藝術家的關聯公鑰具有身份屬性,包括姓名、公司和個人資料。如果不將與公鑰相關聯的私鑰存儲在不可變的ENS系統中,對手將無法執行任何事務。

 

06

總結

 

在本文中,我們提出了一種基於區塊鏈的解決方案,用於證明數字視頻的真實性,在分散的管理中,可以建立對原始視頻創建者或源的安全可靠的可追溯性。我們的解決方案使用分散的存儲系統IPFS、以太坊名稱服務和分散的計算系統。我們提出的解決方案框架、系統設計、算法、序列圖、實現和測試細節都非常通用,可以應用於其他類型的數字內容,如音頻、照片、圖像和手稿。我們的解決方案可以幫助用戶確定視頻或數字內容是否可追蹤到可信的來源,從而幫助打擊深度假冒視頻和音頻。如果視頻或數字內容不可跟蹤,則數字內容不能被信任。我們基於智能合約的解決方案爲代理藝術家提供了一種可信賴的方式,以請求原始藝術家允許他們複製和編輯視頻。智能合約的完整代碼已在Github上提供。智能合約的主要功能和功能已得到適當測試。我們討論了我們的解決方案如何滿足安全性要求,以及如何抵禦常見的安全攻擊。我們在實際以太坊網絡上部署智能合約時,估計了以太坊和天然氣的運營成本。成本估計是最低的,每筆交易總是低於0.095美元。作爲一項未來的工作,我們正在開發前端的DApps,以便用戶能夠自動匹配發布視頻的真實性證明的建立。此外,我們還計劃開發一個可插拔的DApp組件,以便在web瀏覽器中播放或顯示視頻時提供可跟蹤性並建立身份驗證。此外,我們正在設計和實現一個功能全面、可操作的分散信譽系統。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章