網絡協議之:基於UDP的高速數據傳輸協議UDT

原創

2021-12-25 21:34

簡介

簡單就是美。在網絡協議的世界中，TCP和UDP是建立在IP協議基礎上的兩個非常通用的協議。我們現在經常使用的HTTP協議就是建立在TCP協議的基礎上的。相當於TCP的穩定性來說，UDP因爲其數據傳輸的不可靠性，所以用在某些特定的場合，如直播、廣播消息、視頻音頻流處理等不太需要校驗數據完整性的場合。

UDP相對TCP協議而言，其特點就是簡潔，它刪除了在TCP協議中爲了保證消息準確性的各種限制性特徵。簡潔帶來的好處就是快！今天給大家講解一下，基於UDP的高速數據傳輸協議UDT。

UDT協議

UDP因爲其簡單的特性，所以可以做到很多TCP做不到的事情，比如進行大數據量的快速傳輸。這裏並不是要將TCP和UDP分個好壞高下，畢竟各個協議的適應場景不同，他們之所以流行，就是因爲可以在特定的場景發揮出重要的作用。套用中國的一句諺語就是：不管白貓黑貓，能抓到老鼠的，就是好貓。

用好UDP協議，我們就可以快速的傳遞大量的數據，這個協議就是UDT協議。

話說，像這些基礎協議都是老外發明的，而中國的互聯網巨頭都在搶着做平臺、做流量的生意,真的是無話可說….

UDT項目開始於2001年，是由Yunhong Gu在芝加哥伊利諾伊大學國家數據挖掘中心 (NCDM)讀博士期間開發的，並在畢業之後持續的進行維護和升級改進。

UDP的出現是因爲那時候，傳輸更快更便宜的光纖網絡出現了，代替了之前的銅纜線和雙絞線，從而極大的提升了信息傳輸的效率。這時候大家就發現之前使用TCP協議來進行大數據的傳輸會有很大的問題。從而基於UDP的UDT協議出現了。

UDT的第一個版本，也稱爲SABUL（Simple Available Bandwidth Utility Library），UDT通過支持批量數據傳輸，從而方便在私有網絡中進行數據的傳輸。

要注意的是UDT的第一個版本SABUL使用UDP協議進行傳輸數據，同時使用單獨的TCP協議連接傳輸控制消息。

UDT的初始版本是在超高速網絡（1 Gbit/s、10 Gbit/s等）上進行開發和測試的，2003年10月，NCDM實現了從美國芝加哥到荷蘭阿姆斯特丹的平均每秒6.8G比特的傳輸。在30分鐘內的測試中，他們傳輸了大約1.4TB的數據。

從2004年發佈的2.0版本開始，SABUL改名爲UDT，UDT的全稱是UDP-based Data Transfer Protocol，也就是基於UDP的數據傳輸協議。

爲什麼要改成UDT呢？因爲在UDT2.0中，刪除了SABUL中的TCP 控制連接，並使用UDP來處理數據和控制信息。另外，UDT2還引入了一種新的擁塞控制算法，允許協議動態調整UDT和TCP流，實現UDT和TCP流的併發運行。

在2006年，UDT協議升級到了3版本，該協議不僅是在私有網絡中運行了，而是擴展到了商業互聯網中。同時UDT3中的擁塞控制可以進行調整優化，可以在低帶寬的環境中運行，並且允許用戶輕鬆定義和安裝自己的擁塞控制算法。另外，UDT3還顯着減少了系統資源（CPU和內存）的使用。

2007年，UDT4版本在高併發和防火牆穿透方面進行優化和性能的提升。UDT4允許多個UDT連接綁定到同一個UDP端口，它還支持集合連接設置，以便UDP hole punching。

什麼是UDP hole punching呢?

UDP hole punching通常被用在網絡地址轉換 (NAT)中。用來維護穿越NAT的用戶UDP數據包流。它是一種使用網絡地址轉換器在專用網絡中的Internet主機之間建立雙向UDP連接的方法。

什麼是NAT呢？

大家都知道IPV4地址是有限的，很快IPV4地址就快用完了，那怎麼解決這個問題呢？

當然，一個永久解決的辦法是IPV6，不過IPV6推出這麼多年了，好像還沒有真正的普及。

不使用IPV6的話還有什麼解決辦法呢？

這個辦法就是NAT（Network Address Translators）。

NAT的原理是將局域網的IP和端口和NAT設備的IP和端口做個映射。

NAT內部維護着一張轉換表。這樣就可以通過一個NAT的IP地址和不同的端口來連接衆多的局域網服務器。

那麼NAT有什麼問題呢？

NAT的問題在於，內部客戶端不知道自己外網IP地址，只知道內網IP地址。

如果是在UDP協議中，因爲UDP是無狀態的，所以需要NAT來重寫每個UDP分組中的源端口、地址，以及IP分組中的源IP地址。

如果客戶端是在應用程序內部將自己的IP地址告訴服務器，並想跟服務器建立連接，那麼肯定是建立不了的。因爲找不到客戶端的公網IP。

即使找到了公網IP，任何到達NAT設備外網IP的分組還必須有一個目標端口，而且NAT轉換表中也要有一個條目可以將其轉換爲內部主機的IP地址和端口號。否則就可能出現下圖的連接失敗的問題。

怎麼解決呢？

第一種方式是使用STUN服務器。

STUN服務器是IP地址已知的服務器，客戶端要通信之前，先去STUN服務器上面查詢一下自己的外網IP和端口，然後再使用這個外網IP和端口進行通信。

但有時UDP包會被防火牆或者其他的應用程序所阻擋。這個時候就可以使用中繼器技術Traversal Using Relays around NAT (TURN) 。

雙方都將數據發送到中繼器server，由中繼器server來負責轉發數據。注意，這裏已經不是P2P了。

最後，我們有一個集大成者的協議叫做ICE（Interactive Connectivity Establishment ）：

它實際上就是直連，STUN和TURN的綜合體，能直連的時候就直連，不能直連就用STUN，不能用STUN就用TURN。

在使用STUN和ICE的過程中，我們會有一臺網絡主機用來建立端口映射和保持其他UDP端口狀態，但是UDP的狀態通常在幾十秒到幾分鐘的短時間後過期，爲了保證NAT中UDP的狀態和生命週期，於是有了UDP hole punching的技術。通過定時傳輸keep-alive數據包，對NAT中的UDP狀態進行更新。

UDT的缺點

因爲UDT是基於UDP協議的，但是UDP協議因爲其簡潔的特性，所以並不具備安全性的特徵。所以基於其上的UDT協議因爲缺乏安全特性，所以在商業環境中應用會受到一定的限制。

不過UDT的新版本已經在開發中，大家可以期待一下。

總結

UDT被廣泛用於高性能計算，比如光纖網絡上的高速數據傳輸。我們後續會在netty中告訴大家怎麼使用UDT協議。

本文已收錄於 http://www.flydean.com/11-udt/

最通俗的解讀，最深刻的乾貨，最簡潔的教程，衆多你不知道的小技巧等你來發現！

歡迎關注我的公衆號:「程序那些事」,懂技術，更懂你！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

網絡協議之:基於UDP的高速數據傳輸協議UDT

簡介

UDT協議

UDT的缺點

總結

k8s yaml 佔位符裏如何將字符串類型轉爲整形

Linux操作系統的安裝策略與過程

安全分析：國內一些常見的汽車保險欺詐案件

01 穩定性（一）如何應對事故並做好覆盤？

Selenium與PhantomJS：自動化測試與網頁爬蟲的完美結合

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結