採樣對信號頻率成分的影響

數字計算機的普及促進了語音學的研究, 使人們能夠快速, 大量, 低成本地記錄, 保存, 交換和分析聲音信號. 然而, 由於數字計算機的核心是用離散的數字量來表達和記錄所有信息的, 它從本質上不能被用來描述人類已有的全部數學概念和方法, 當然也就不能完全精確地表達所有的物理概念和物理測度. 單就聲音信號來說, 物理上我們所希望測量的可能是聲壓隨時間的變化, 它在數學上對應着某個關於時間的連續函數. 數字計算機不能直接表達這種連續信號, 而只能表達離散的時間序列(即離散信號). 它甚至不能表達所有的離散信號, 而只能表達在取值上也是離散的離散信號(即數字信號). 所以我們用計算機來處理任何一種物理信號時所面臨的首要問題就是連續信號的數字化問題(或稱”模/數轉換”問題). 一般人們把連續信號到離散信號的過程叫採樣, 把測量值本身的離散化過程叫量化. 這裏我想講清楚的是採樣問題.

使用計算機前我們必須明確採樣過程對原始的連續信號所造成的影響, 然後纔能有信心地做後續的各種處理和分析工作. 著名的採樣定理(Nyquist-Shannon sampling theorem)就是幫助我們建立這種信心的一個重要的指導性定理. 但是很遺憾, 人們容易對它有一些經常性的誤解. 現在我試試能不能儘量少用數學語言地把它說清楚.

定理涉及了幾個概念, 包括”採樣”,“採樣頻率”,“帶寬”和”完全重構”. 首先, “採樣”在這裏指的是理想採樣, 即直接記錄信號在某時間點的精確取值. 所以說, 採樣定理只涉及到了從連續信號到離散信號的理想採樣過程, 而未涉及到對測量值的量化過程. 其次, “採樣頻率”指單位時間內的採樣點數, 它還暗示了這裏討論的採樣是一種週期性的操作, 非週期性採樣不在它討論的範圍之內. 第三,“帶寬”是一個信號的一種頻域參數. 這裏不得不提到”傅立葉分析”這種數學方法. 極簡略地說, 滿足某種數學條件的一個隨時間變化的信號(現實中的物理信號大多滿足該條件), 或稱時域信號, 可以被變換成一個隨頻率變化的信號(或稱頻域信號), 這對時域信號和頻域信號之間的關係是通過由傅立葉提出的變換和反變換計算方法確定的. 時域信號和頻域信號其實是對同一物理測度從不同角度各自完備的表述. 當通常的時域信號被變換到頻域內時, 它取值不爲零的部分所跨越的頻率範圍就是這個信號的帶寬. 定理中關於帶寬的表述有時會被誤用成”信號最高頻率的兩倍”, 因爲對於具有低通性質的信號來說, 其通帶最高截止頻率和帶寬是一至的. 還好, 這個誤解對語音處理的影響不是很大. 第四, 所謂”完全重構”指的是給定了前面條件下得到的精確採樣值, 數學上可以精確地計算出原來連續信號中任何一個時間點的信號值. 其實, 從定理的數學證明中可以順帶推出用來”完全重構”原始信號的數學公式(即Nyquist-Shannon差值公式). 值得注意的是, 這個公式在數字計算機上是不可能精確實現的, 至少因爲其中所使用的一族函數在時域內是無限長的.

採樣定理從1928年被Nyquist提出到1949年被Shannon正式地證明, 這中間跟計算機沒有什麼直接關係. 但是因爲數字計算機只能處理離散的數字信號, 連續信號必須經過採樣和量化才能被計算機處理, 所以採樣定理對計算機化的信號處理技術具有基礎性的指導意義.

現在我們來着重討論採樣定理中”兩倍”的含義, 因爲我覺得人們最容易從它的字面上引申而產生誤解. 一種普遍的誤解是這樣表述的: “如果用採樣頻率Fs對一個信號採樣, 信號中Fs/2以上的信息會消失”. 這種誤解不僅是錯誤的, 而且是危險的. 採樣定理的證明過程顯示, 當用採樣頻率Fs對一個信號採樣時, 信號中Fs/2以上的頻率成分不是消失了, 而是對稱地映象到了Fs/2以下的頻帶中, 並且和Fs/2以下的原有頻率成分迭加起來. 這個現象叫做”混疊”(aliasing), 是任何一個連續信號被離散化的必然結果(數學上通過傅立葉分析可以證明). 我們可以用下面圖示的例子來說明這個現象.

圖遺失(不影響閱讀)

上半圖中的藍色信號是 x(t)=cos(2*pi*t) 的一部分, 它在頻域內只在 F=1Hz 處有一條譜線. 當我們用 Fs=4Hz 對它採樣時, 可以得到的採樣點如上半圖中的紅圈所示. 因爲我們的信號和採樣頻率滿足採樣定理的條件, 所有我們可以從這些點重構信號x(t). 下半圖中的藍色信號是 y(t)=cos(2*pi*t)+cos(6*pi*t) 的一部分, 它在頻域內有 F=1, 3Hz 兩條譜線. 當我們還用 Fs=4Hz 對它採樣時, 可以得到的採樣點如下半圖中的紅圈所示. 注意, 下半圖中採樣點的取值剛好分別是上半圖中對應採樣點取值的2倍. 如果用下半圖中的採樣點來重構信號, 得到的將是 2*cos(2*pi*t) , 如綠色點劃線所示, 而非原信號y(t). 看上去原來 F=3Hz 的頻率成分好象是消失了, 其實這個頻率成分沿着 Fs/2=2Hz 對稱地映象到了 F=1Hz 後與原有的頻率成分迭加到了一起. 這種對於低於Fs/2頻率成分的破壞是無法恢復的. 所以說, 採樣定理的一個重要指導意義是給出了防混疊的最低條件. 混疊本身是採樣的必然效應, 只不過如果混疊到原信號帶寬範圍內的頻率成分爲零的話, 信號不會被破壞, 也就能”完全重構”了.
前面提到的誤解可能導致的危險後果是對所要觀測的頻帶範圍內引入混疊畸變. 計算機的電子器件(如顯示器)中有很多高頻噪音信號, 它們不會因爲高於Fs/2而消失, 反而會因採樣而混入低頻帶. 語音信號本身雖然整體上是低通特性(約-6dB每倍頻程), 但它的高頻段不會是絕對的零. 這就是爲什麼在現實的採樣技術中一定要有反混疊濾波步驟的原因. 這裏的邏輯關係是: 採樣必然導致混疊 –> 滿足採樣定理條件下的混疊不會破壞信號(可重構) –> 反混疊濾波是把被研究信號預先處理成滿足採樣定理條件的信號. 當然現實中的反混疊濾波器也不可能是理想的. 濾波器越接近理想, 造價也就越高. 音響處理中有一種技術叫”過採樣”(oversampling), 其實是用性能一般(較便宜)的濾波器對信號濾波後再用遠遠大於兩倍通頻帶的採樣頻率來採樣, 使造成混疊的頻率成分遠高於濾波器的截止頻率, 因爲那裏的帶阻性能相對會更好些. 這些扯到技術細節了, 不多說. 不過我們應該看到, 一般計算機聲卡都不標出反混疊濾波器的指標, 因爲聲卡的設計往往側重於放音; 而象CSL這種專業錄音設備會給出詳細的指標. 顯然, 它們的價格差別不是沒有道理的.
關於採樣定理和濾波就討論這麼多. 再講一個有趣的現象, 可以用採樣定理來解釋. 當我們看電影時, 如果裏面有螺旋槳飛機啓動的鏡頭, 我們會看到螺旋槳片先是越轉越快, 然後在某時會突然看起來變慢了, 甚至反轉. 這是因爲電影攝像機相當於以一個固定的頻率對連續轉動的螺旋槳片採樣, 當槳片的轉速超過Fs/2並繼續提高時, 我們看到的就是混疊干擾下的結果. – 這是題外話.

本文轉自博客園

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章