五步拳入門之從波束賦形---廣義旁瓣相消器(General sidelobe canceller,GSC)

0.概述

       低功耗智能語音信號處理業務開發流程首先通過在學術領域中的理論算法結合具體場景選取適當的方法,通過matlab/python先實現算法對音頻進行處理,如果結果達到理想效果,再編寫C語言工程。編寫C工程的過程需要先實現浮點工程,然後可以通過matlab或者Python去改變相關變量的浮點精度去驗證變量定標的誤差和精度是否在可接受範圍。定標將會在後面的文章中補充介紹,定標過後再去實現C工程的定點版本。也就是說這個過程我們一共有四個版本的工程需要實現。matlab/python(1浮點、2定點)版本,C工程(3浮點、4定點),由於目前多數低功耗的平臺都是要定點C工程的版本,所以這個版本是我們最終需要的版本,而實現這個版本需要經歷上述1版本驗證算法、2版本定標、3版本輔助定點版本實現這一系列環節,當然如果你要是高手請忽略上述正常人的路子。
而從《低功耗智能語音信號處理》這一標題上看,業務涉及面比較廣,需要數學理論、工程經驗、還有最近很火的AI相關方法。大體涉及下面幾個大塊。
1.信號處理環節(降噪、增強語言)—原始信號的預處理是影響訓練模型好壞的重要原因
2.模型訓練(喚醒、識別)
3.工程實現。(C工程、資源/性能)

       習武通過最簡單的套路練習基本功和入門是最好的方法。而今天我們就通過一種波束賦形方法,廣義旁瓣相消器這一信號處理增強主瓣聲音強度,降低旁瓣環境音的算法實現開始我們的入門基礎套路練習。

1.背景和概念

       單麥克風語音增強只需一路語音信號, 算法複雜度小, 硬件要求低,自1970年代以來已經得到了深入的研究, 提出了譜減法[1,2]、 最小均方誤差方法[3,4], 維納濾波法[5]和子空間方法[6]等等。 這些方法在通常情況下可以獲得良好的噪聲抑制性能, 然而在非理想條件下, 噪聲總是來自於四面八方, 且其與語音信號在時間和頻譜上常常是相互交疊的, 再加上回波和混響的影響(如圖1.1), 利用單麥克風捕捉相對純淨的語音都是很困難的工作。 若在空間放置多個麥克風, 當語音和周圍環境信息被多個麥克風聚集時, 麥克風陣列可以在期望方向上有效地形成一個波束去拾取波束內的信號, 並消除波束外的噪聲, 從而達到同時提取聲源和抑制噪聲的目的, 所以利用陣列來取代單麥克風成爲進一步提高語音增強效果的有效途徑[7]。
陣列信號處理是信號處理的主要領域之一,一直以來都是
由於其在各個領域的廣泛應用,過去對其進行了廣泛的研究。
我們從工程中這一實際問題出發,慢慢的引出需要補充的課程,如信號與系統,甚至數學基礎,以及所有工程中遇到的概念和問題,有時間和興趣一個一個來梳理。
波束賦形(Beamforming),又稱波束成型、空域濾波,是一種使用傳感器陣列定向發送和接收信號的信號處理技術。波束賦形技術通過調整相位陣列的基本單元的參數,使得某些角度的信號獲得相長干涉,而另一些角度的信號獲得相消干涉。波束賦形既可用於信號發射端,又可用於信號接收端。該技術在雷達、無線通信、語音處理等領域應用廣泛。本文所描述的廣義旁瓣相消器(General sidelobe canceller,GSC)便是其中一種波束賦形算法。

2.算法原理與應用

2.1beamforming框架

首先以線麥陣列爲例
在這裏插入圖片描述
1)若目標信號垂直麥克風陣列入射,則通過簡單的相加就可以獲得想幹信號;
2)如果目標信號以θ(θ90)\theta\left(\theta \neq 90^{\circ}\right)入射時,由於相位上的偏差導致信號存在一定程度的相消現象。
       針對上述現象採用適當的權重向量,補償麥克風的時延,使 θ\theta方向入射信號能夠想幹疊加。在這裏插入圖片描述

2.2beamforming最佳權向量

2.3GSC算法

在這裏插入圖片描述

3.MATLBA實現

4.C工程實現

5.總結

[1] Boll S F. Suppression of acoustic noise in speech using spectral subtraction. IEEE Transactions on Acoustics, Speech and Signal Processing, 1979, 27(2):113–120.
[2] Kamath S, Loizou P. A multi-band spectral subtraction method for enhancing speech corrupted by colored noise. Proceedings of IEEE International Conference on Acoustics,
Speech, and Signal Processing, Orlando, Florida, 2002, 675–678.
[3] Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error shorttime spectral amplitude estimator. IEEE Transactions on Acoustics, Speech and Signal
Processing, 1984, 32(6):1109–1121.
[4] Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error logspectral amplitude estimator. IEEE Transactions on Acoustics, Speech and Signal Processing, 1985, 33(2):443–445.
[5] Scalart P, Filho J V. Speech enhancement based on a priori signal to noise estimation. Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing,
volume 2, Atlanta, GA, 1996, 2:629–632.
[6] Ephraim Y, Van Trees H. A signal subspace approach for speech enhancement. IEEE
Transactions on Speech and Audio Processing, 1995, 3(4):251–266.
[7] 崔瑋瑋. 基於麥克風陣列的聲源定位與語音增強方法研究[D]. 北京: 清華大學, 2009.
未完待續…

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章