基於GAN的無線通信與網絡應用設計----通信信號的特徵提取

由於人工智能的發展,各大高校也逐漸加大研究力度。本文源自於個人的本科畢業設計,課題由學校老師分配,設計內容源自於個人。由於個人知識儲備以及能力有限,有不足之處我會及時修改。

1.GAN在通信領域的訓練分析

  • 訓練數據集的由來

對於網絡傳輸,最常用的報文有TCP和UDP兩種形式,Jeffrey Erman[1]等人在2007年發表的一篇名爲基於半監督學習的實時/離線流量區分的文章,已經詳述通過聚類等算法實現了流量的區分,而且實驗結果特別理想,這就爲我的本篇文章的數據來源提供了理論的可行性,由於機器的訓練過程是需要大量可靠的數據爲前提的,但是Jeffrey Erman等人有專門的通信信號記錄設備,可以輕鬆蒐集某些時間段內,各種通信信號的流量以及持續時長,包括HTTP協議,P2P協議以及FTP等多種通信信號,而這點對於我來說確實是很難實現的,因爲我就目前的動手實踐水平,在缺少相應設備的前提下,很難準確的對這類數據進行提取,同時由於個人能力的有限,對這些大數據的清洗也是不容易做到的,所以本次設計使用到的訓練數據是我人爲“臆造”的。

  • “臆造”的可行性—映射思想

在數學上描述函數的自變量與因變量是一種映射關係,及自變量X→f(X),這就爲我提供了一種思想,我個人可以將真實的信號數據與我“臆造”的數據構建成一一映射的關係,也就是說,我將“臆造”的通信信號數據送入生成對抗網絡(GAN)模型中進行學習,如果生成對抗網絡(GAN)模型可以對這些“臆造”的數據進行學習,並得到相應的成果,那麼我們就可以通過反映射的思想(從“臆造”回到真實數據),說明生成對抗網絡(GAN)技術是可以應用在通信網絡中,映射思想類似於兩塊陸地的橋樑,起到連接作用,所以合理適當的數據映射會方便我們的實驗進行,不合理或者複雜的映射關係,在目前來看,對我們的程序設計是起阻礙作用的,這樣會提高程序的複雜度,同時需要大量的時間去運行我們的程序。

  • 訓練數據集的分析

衆所周知,按照通信的媒質可分爲有線通信與無線通信,例如有線通信中的光纖通信,其信號串擾小,抗電磁干擾、抗噪聲能力強。與之相比的無線通信,由樊昌信等撰寫的書中[2]可知,無線通信信道有一部分屬於隨參信道,會受到溫度,季節,氣候等條件的影響,並且在無線通信中,由於移動臺在運動,收發兩點間的傳輸路徑也在發生變化,就會致使信道參量發生變化,會產生多徑傳播,帶來多徑效應,多徑效應對信號的損傷是極其嚴重的,會產生頻率的彌散等情況,所以對於我們的輸入數據集,嚴重的隨機噪聲是必須要考慮的,在我們“臆造”的數據中,有必要加入極大的隨機參數以及一定數量的無用數據。

2.基於GAN的一般通信信號的特徵提取

  • 初始信號的模型構建

在樊昌信等人編寫的《通信原理》[2]中一般通信系統模型類似,包括信源,發送設備,信道,接收設備,信宿等組成部分,且在《通信原理》一書中,各部分理論分析使用最多的信號波形是單音正弦波:

                       f(t)=A cos⁡(wt+φ)

爲了不失去一般性,我們通常會令振幅A=1,初始相位φ=0,那麼整個形式就會變成:

                       f(t)=cos⁡(wt)

爲了方便建模,讓信號的波形可以更好的通過座標軸來反應,且規定在嚴格的週期內(初步約束在[-2π,2π]的區間內,包含兩個信號波形),我們也令w=1,這樣我們就得到我們建模信號使用的最終波形形式:

                       f(t)=cos⁡(t)

在完成上述分析之後,我們知道計算機是不可能完全按照人的思維模式來處理實際遇到的問題,計算機是個二值世界(0和1),衆所周知,基於最基本的數字信號處理(Dsp)知識,我們不是對連續的信號進行直接研究,而是通過抽樣,量化,編碼等過程形成時間離散,幅度也離散的數字信號。但是爲了便於理論研究,在數字信號處理(Dsp)的內容中,我們一般是將幅度連續,時間連續模擬信號波形x(t),經過抽樣(抽樣是一個線性的過程),得到時間離散,幅度連續的離散時間信號x(kt),同時我們將離散時間信號理想化,得到我們所研究的信號序列x[n],注意,這裏的理想化有兩點需要注意,第一點是理想抽樣,即不考慮脈寬效應;第二點是我們認爲量化字長效應是無限的,不考慮有限字長效應。有了上述思想,便得到了實際信號建模的方法,可以在一個正弦信號週期內,對其進行部分點的採樣,這個採樣方式我們選取等間隔採樣也可以採用隨機採樣,進而得到信號的特徵點,這個便是我們所得到的真實信號的數據,生成對抗網絡(GAN)所輸入的數據也是這類數據。但是爲了直觀的反應信號的包絡情況,我們再結果輸出之後,會根據這些頻率點繪製出信號的整體包絡。

  • 生成器模型(generator model)的構建

考慮到我們的真實數據是二維的數據點,表示特定時間的信號幅度值,在一般意義上說,我們不需要搭載的太過於複雜的生成器模型。生成器的作用是生成隨機的信號的特徵分佈點,可以是任意的,我們不對其做任何約束,所以就構成一個兩層的全連接層網絡,經過分析數據樣本分佈可知,數據結構並不繁瑣,我們可以直接創建一個兩層結構的生成器,由於生成器不能接觸真實的樣本分佈,所以我們無需將其構建的太過於複雜,其原因是,過於複雜的模型雖然可以“學習”得到真實信號的波形特點,但是可能會造成學習過程的複雜化。由訓練經驗可知,對於特定的數據類型使用特定的訓練方式是優化模型的重要參考指標。迴歸到生成器的模型,我們這兩層用於處理生成器自身“隨機”產生的信號特徵點數據,第一層使用SoftMax函數模型來處理數據,第二層使用sigmoid函數模型進行再處理,以上我們便得到了生成器的最初模型。

  • 鑑別器模型(discriminator model)的構建

由於鑑別器需要接觸真實信號的特徵點分佈情況,所以在鑑別器構建的時候,可能要稍微比生成器要複雜一些。
首先我們先將真實的信號數據送給我們的鑑別器,鑑別器的第一層接收真實信號,並對其進行信號特徵的“學習”,生成器的第二層用於接受生成器得到信號數據,並對生成器所生成的信號特徵進行第一次“學習”,我們需要注意的是,當我們輸入生成器所生成的信號特徵數據時,這一層是要重複使用的,通過動態調整這層的權重來完成鑑別器損失值的最小化。爲了讓生成器得到更好的信號數據反饋,我們在對其進行第二次“學習”,即再增加一層全連接層,得到更爲優秀的學習效率,至此我們已經得到了鑑別器的模型。

  • 基於GAN的仿真實驗結果

第0次訓練

第500次訓練

第1500次訓練

第2000次訓練

  • 仿真實驗結果分析

起初剛開始訓練生成對抗網絡(GAN)模型的時候,生成器隨意生成的信號特徵點所畫出的包絡與真實數據的包絡相比,相差甚遠,可以說沒有任何的關聯,雖然通過TensorFlow的代碼,我們可以得到生成器與鑑別器的準確率(accuracy),但是不具備參考的意義,因爲直觀的從我們肉眼也能判斷出兩者信號的包絡式完全不一樣的。隨着程序運行到第1500次,我們可以發現,生成器與鑑別器信號的包絡已經有大致相同的趨勢,但是我們仍然可以通過肉眼直接觀察出,信號雖然相位信息逐漸趨於明顯,但是幅度等信息還是不一致的。當我們實驗進程來至2000次的時候,我們已經無法從肉眼直接看出真實信號的包絡與生成信號包絡之間的區別,因爲從肉眼角度出發,兩者已經完全重疊,但是肉眼的精確度不高,只能區分誤差較大的事物,所以最優的衡量標準還是咱們所得到的衡量標準數據,我在圖中顯示了生成器與鑑別器各自判別的準確率(accuracy),我們奇怪的發現兩者的概率相等均爲0.5,如果單單從機器學習的角度來看,0.5的準確率對於一個模型來說,沒有任何意義,在數據分類問題中,0.5概率的準確率意味着機器並不能區分數據的真(1)與假(0)。但是在深度學習的生成對抗網絡(GAN)模型裏面,0.5的概率是我們迫切所希望得到的,衆所周知,當一件未知事件發生的概率P=0.5時,信息所包含的信息量就越大,也就意味着我們並不知道這個事件到底會朝什麼樣的方向去發展,按照這個想法,我們迴歸到這個0.5概率的準確率,當鑑別器判定生成器所生成的信號與真實信號是否一致時,給出了0.5概率的可能性,也就是說,知道真實信號分佈的鑑別器,已經無法判斷生成器生成的信號與真實信號之間是否還有誤差,這個時候,咱們生成器生成的信號(信號包絡是通過特徵點繪製的)就可以完美的媲美真實的信號,達到“以假亂真”的地步!可以說,生成器已經完全獲取了真實信號的特徵數據了,生成對抗網絡(GAN)模型是可以對通信信號進行學習的,在此基礎之上,若我們的信道是較爲理想的信道,那麼我們的GAN技術便可用於穩定信號的特徵獲取,以及信號的特徵識別,這樣極大的優化了信號與信息處理領域的信號特徵提取的相關工作。
3.基於GAN的無線通信信號的特徵提取

  • 無線通信信號與一般信號的區別

在魏崇毓等人編寫的《無線通信基礎及應用》[3]中,我們可以瞭解到,通信按照傳播媒質的不同可以分爲有線通信與無線通信,爲了將無線通信的缺點擴大化,我們以有線通信中的光纖通信爲例子,光纖通信的主要優點有抗干擾的能力強,相比於無線通信,受噪聲,氣溫,電離層特性等因素的影響小。在無線通信的信道中,有一部分屬於隨參信道,即乘性干擾隨時間劇烈變化,如靠天波傳播的無線信道,在天波傳播時,電離層的高度和離子濃度隨時間,季節和年份的變化而發生不停歇的變化,這就會使信道特性隨着這些因素的變化而變化,此外,在無線通信中,由於移動臺(MS)在運動,移動臺(MS)與基站(BS)之間的傳輸路徑也在不斷變化,使得信道參量也在不斷的變化,信號經過幾條路徑到達接收端,而且每條路徑的長度(時延)和衰減都隨時間的變化而改變,即存在多徑傳播現象,多徑傳播會對信號產生多徑效應,進而對傳輸的信號質量有極大的消極影響。
綜上所述, 無線通信的模型與無線通信信號所受到的各種干擾較大,最直接造成的影響便是信號波形的畸變,主要包括幅度的畸變與相位的畸變,在本節內容中,我們在上述已得的信息基礎上,在富含噪聲的信號波形中,提取特徵點,然後讓我們的生成對抗網絡(GAN)去學習,看是否可以恢復大致的信號的包絡。

  • 在信號幅度畸變下的GAN仿真實驗

我們在真實信號所獲取的所以頻率點上加入穩定的噪聲,換到模型中來說,就是在特徵點處加入隨機數。
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在模型剛開始訓練的時候,生成器所生成的信號包絡,生成器在最開始是無法通過簡單的幾次學習就可以完全獲取真實信號的特徵點分佈情況進而恢復真實信號包絡。在相同的生成對抗網絡(GAN)模型下,經過2000次的訓練,生成器近似可以恢復出真實信號的整體包絡趨勢,但是無法做到完全一致,這種情況取決於咱們輸入的噪聲,因爲有噪聲的影響,我們也並不希望模型可以完全恢復信號的包絡,因爲如果在有噪聲的情況下恢復出信號,那麼恢復的信號一定會將噪聲也算在有用信號之內,我們不是爲了追求完美的圖形特徵而去擬合信號包絡,得到一條優美的曲線,而是通過生成對抗網絡(GAN)模型的訓練,能夠獲取原始信號的特徵,從第2000次訓練之後,我們可以看到,生成器所擬合的信號包絡與真實信號包絡已經趨近一致,這點從生成器和鑑別器的準確率可以看出,從第2000次訓練後準確率始終保持在[0.48-0.52]之間,這個概率對於此問題來說,已經屬於很好的結果了。

  • 在信號相位畸變下的GAN仿真實驗---------本次實驗的重點

對於一般信號而言,無失真傳輸的條件是指傳輸信號僅在幅度上發生線性變化,而相位的變化會造成嚴重的碼間干擾,無論是對模擬通信信號還是數字通信信號而言。在本節,我們將對信號做一定的相位改變,在相同生成對抗網絡(GAN)模型的訓練水平下,看我們是否能夠再次通過生成器獲取真信號的分佈特徵。如果相鄰的兩個信號保持着幅度連續,相位差恆定,那麼就一般意義而言,這與最初的實驗在本質上是一樣的,因爲以我們已知的知識而言,連續變化的相位畸變,是我們在處理信號時所面臨的最困難的問題,大部分通信系統爲了區分具有不同特徵的通信信號,會在選擇在發送端去避免這個問題。就上述內容,首先產生一個相位畸變連續變化的兩個信號。然後通過特徵點的抽取,當其送入生成對抗網絡(GAN)模型,來觀察最終的結果。

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述

訓練結果並不理想,可以說完全無任何參考價值,在穩定訓練後(大概第1200次訓練之後),可以看到,真實的信號由於連續的相位畸變,始終處於不停的變化之中,而生成對抗網絡(GAN)模型隨着真實信號分佈的改變也在不停的“學習”,看似很快就會達成包絡的擬合,但是整個模型似乎始終處於一種,真實信號在“奔跑”,生成器生成的信號在“追趕”的狀態中,也就是說我們通過TensorFlow構建的生成對抗網絡(GAN)目前無法追蹤這種動態的變化。
4.實驗結果分析

目前實驗的缺陷還是很多的,首先我在對信號特徵點的抽取的時候,我並沒有嚴格的按照抽樣定理的最低標準要求對信號進行特徵抽取,即無法估在抽樣頻率fs=2f時候,模型是否可以完成自己的任務。
其次,對於穩定的信號而言,生成對抗網絡(GAN)是有能力按照自己的學習機制對此類信號進行學習的,在獲取這類信號特徵的前提下,進而恢復真實信號的包絡情況。所以,對於信號類型不同的通信信號,生成對抗網絡(GAN)是具有分別學習他們的特徵,然後對這些信號進行區分的能力的。隨着條件的約束,實驗也在繼續深入,第一次加入了穩定的噪聲,在這個條件的前提下,生成對抗網絡(GAN)模型不負衆望,在經過多次訓練之後,可以對此類信號進行一定的區分,在第二次實驗中,將模型的應用更實際化,因爲穩定無噪聲的通信信號在無線通信與網絡中比較難實現,更多的是一種富含隨機噪聲且相位有混疊的情況,所以在最後一次實驗中,我們將困難極大化,加入了連續的相位畸變,在這一次實驗結果中,發現生成對抗網絡(GAN)模型並沒有達到理想的結果。針對這種情況,原因可能有兩種,第一點是我們的生成對抗網絡(GAN)模型在處理動態連續變化的問題並不具備優勢,與前兩次實驗相比,第一次是暫態問題,第二次雖然我們加入了一定的隨機噪聲,但是噪聲的變化並不劇烈,其次相比於相位的改變,正常的通信信號對幅度的包容性還是很高的;第二點是我們模型的深度不足,無法處理動態問題。針對上述兩種猜想,個人傾向於第二種,因爲通過參考相關文獻可知,目前生成對抗網絡(GAN)的變種已經達到上百種,在未來幾年裏,還會有長足的發展空間。

參考文獻
[1] effrey Erman, Anirban Mahanti, Martin Arlitt, Ira Cohen, Carey Williamson. Offline/Realtime traffic classification using semi-supervised learning[J]. Performance Evaluation, 2007, 64(9).
[2] 樊昌信.通信原理[M]. 曹麗娜. 第七版.北京:國防工業出版社, 2017
[3] 魏崇毓.無線通信基礎及應用[M]. 西安:西安電子科技大學出版社,2009
[4] Ian J. Goodfellow, Jean Pouget-Abadie. Generative Adversarial Network[EB/OL]. (2014-06-10). https://arxiv.org/abs/1406.2661.
[5] Tao Liu, Alberto E. Cerpa. Temporal Adaptive Link Quality Prediction with Online Learning[J]. 2014, 10(3):1-41.
[6] Bhutani, Gitanjali. Application of Machine-Learning Based Prediction Techniques in Wireless Networks[J]. International Journal of Communications, Network and System Sciences, 2014, 7(5).
[7] 王坤峯, 苟超, 段豔傑 , 林懿倫, 鄭心湖, 王飛躍.生成式對抗網絡GAN的研究進展與展望[J]. 自動化學報, 2017, 43(03):321-332.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章