傅里葉變換與不確定性

在現代數學中有一個很容易被外行誤解的詞彙:信號(signal)。當數學家們說起「一個信號」的時候,他們腦海中想到的並不是交通指示燈所發出的閃爍光芒或者手機屏幕頂部的天線圖案,而是一段可以具體數字化的信息,可以是聲音,可以是圖像,也可是遙感測量數據。簡單地說,它是一個函數,定義在通常的一維或者多維空間之上。譬如一段聲音就是一個定義在一維空間上的函數,自變量是時間,因變量是聲音的強度,一幅圖像是定義在二維空間上的函數,自變量是橫軸和縱軸座標,因變量是圖像像素的色彩和明暗,如此等等。

在數學上,關於一個信號最基本的問題在於如何將它表示和描述出來。按照上面所說的辦法,把一個信號理解成一個定義在時間或空間上的函數是一種自然而然的表示方式,但是它對理解這一信號的內容來說常常不夠。例如一段聲音,如果單純按照定義在時間上的函數來表示,它畫出來是這個樣子的:

image

這通常被稱爲波形圖。毫無疑問,它包含了關於這段聲音的全部信息。但是同樣毫無疑問的是,這些信息幾乎沒法從上面這個「函數」中直接看出來,事實上,它只不過是巴赫的小提琴無伴奏Partita No.3的序曲開頭幾個小節。下面是巴赫的手稿,從某種意義上說來,它也構成了對上面那段聲音的一個「描述」:

image

這兩種描述之間的關係是怎樣的呢?第一種描述刻劃的是具體的信號數值,第二種描述刻劃的是聲音的高低(即聲音震動的頻率)。人們直到十九世紀才漸漸意識到,在這兩種描述之間,事實上存在着一種對偶的關係,而這一點並不顯然。

1807年,法國數學家傅立葉(J. Fourier)在一篇向巴黎科學院遞交的革命性的論文Mémoire sur la propagation de la chaleur dans les corps solides(《固體中的熱傳播》)中,提出了一個嶄新的觀念:任何一個函數都可以表達爲一系列不同頻率的簡諧振動(即簡單的三角函數)的疊加。有趣的是,這結論是他研究熱傳導問題的一個副產品。這篇論文經拉格朗日(J. Lagrange)、拉普拉斯(P-S. Laplace)和勒讓德(A-M. Legendre)等人審閱後被拒絕了,原因是他的思想過於粗糙且極不嚴密。1811年傅立葉遞交了修改後的論文,這一次論文獲得了科學院的獎金,但是仍然因爲缺乏嚴密性而被拒絕刊載在科學院的《報告》中。傅立葉對此耿耿於懷,直到1824年他本人成爲了科學院的祕書,才得以把他1811年的論文原封不動地發表在《報告》裏。

用今天的語言來描述,傅立葉的發現實際上是在說:任何一個信號都可以用兩種方式來表達,一種就是通常意義上的表達,自變量是時間或者空間的座標,因變量是信號在該處的強度,另一種則是把一個信號「展開」成不同頻率的簡單三角函數(簡諧振動)的疊加,於是這就相當於把它看作是定義在所有頻率所組成的空間(稱爲頻域空間)上的另一個函數,自變量是不同的頻率,因變量是該頻率所對應的簡諧振動的幅度。

這兩個函數一個定義在時域(或空域)上,一個定義在頻域上,看起來的樣子通常截然不同,但是它們是在以完全不同的方式殊途同歸地描述着同一個信號。它們就象是兩種不同的語言,乍一聽完全不相干,但是其實可以精確地互相翻譯。在數學上,這種翻譯的過程被稱爲「傅立葉變換」。

傅立葉變換是一個數學上極爲精美的對象:傅立葉變換就象是把信號徹底打亂之後以最面目全非的方式複述出來,而一切信息都還原封不動的存在着。要是科幻小說作家瞭解這一點,他們本來可以多出多少有趣的素材啊。

在傅立葉變換的所有這些數學性質中,最不尋常的是這樣一種特性:一個在時域或空域上看起來很複雜的信號(譬如一段聲音或者一幅圖像)通常在頻域上的表達會很簡單。這裏「簡單」的意思是說作爲頻域上的函數,它只集中在很小一塊區域內,而很大一部分數值都接近於零。例如下圖是一張人臉和它對應的傅立葉變換,可以看出,所有的頻域信號差不多都分佈在中心周圍,而大部分周邊區域都是黑色的(即零)。

這是一個意味深長的事實,它說明一個在空域中看起來佔滿全空間的信號,從頻域中看起來很可能只不過佔用了極小一塊區域,而大部分頻率是被浪費了的。這就導出了一個極爲有用的結論:一個看起來信息量很大的信號,其實可以只用少得多的數據來加以描述。只要對它先做傅里葉變換,然後只記錄那些不接近零的頻域信息就可以了,這樣數據量就可以大大減少。

image

基本上,這正是今天大多數數據壓縮方法的基礎思想。在互聯網時代,大量的多媒體信息需要在儘量節省帶寬和時間的前提下被傳輸,所以數據壓縮從來都是最核心的問題之一。而今天幾乎所有流行的數據壓縮格式,無論是聲音的mp3格式還是圖像的jpg格式,都是利用傅立葉變換才得以發明的。從這個意義上說來,幾乎全部現代信息社會都建立在傅立葉的理論的基礎之上。

這當然是傅立葉本人也始料未及的。

傅立葉變換這種對偶關係的本質,是把一塊信息用徹底打亂的方式重新敘述一遍。正如前面所提到的那樣,一個信號可能在空域上顯得內容豐富,但是當它在頻域上被重新表達出來的時候,往往就在大多數區域接近於零。反過來這個關係也是對稱的:一個空域上大多數區域接近於零的信號,在頻域上通常都會佔據絕大多數頻率。

image

有沒有一種信號在空域和頻域上的分佈都很廣泛呢?有的,最簡單的例子就是噪聲信號。一段純粹的白噪聲,其傅立葉變換也仍然是噪聲,所以它在空域和頻域上的分佈都是廣泛的。如果用信號處理的語言來說,這就說明「噪聲本身是不可壓縮的」。這並不違反直覺,因爲信號壓縮的本質就是通過挖掘信息的結構和規律來對它進行更簡潔的描述,而噪聲,顧名思義,就是沒有結構和規律的信號,自然也就無從得以壓縮。

另一方面,有沒有一種信號在空域和頻域上的分佈都很簡單呢?換句話說,存不存在一個函數,它在空間上只分布在很少的幾個區域內,並且在頻域上也只佔用了很少的幾個頻率呢?(零函數當然滿足這個條件,所以下面討論的都是非零函數。)

答案是不存在。這就是所謂的uncertainty principle(不確定性原理)。這一事實有極爲重要的內涵,但是其重要性並不容易被立刻注意到。它甚至都不是很直觀:大自然一定要限制一個信號在空間分佈和頻率分佈上都不能都集中在一起,看起來並沒有什麼道理啊。

這個原理可以被儘量直觀地解釋如下:所謂的頻率,本質上反應的是一種長期的全局的趨勢,所以任何一個單一的頻率,一定對應於一個在時空中大範圍存在的信號。反過來,任何只在很少一塊時空的局部裏存在的信號,都存在很多種不同的長期發展的可能性,從而無法精確推斷其頻率。

讓我們仍然用音樂來作例子。聲音可以在時間上被限制在一個很小的區間內,譬如一個聲音只延續了一剎那。聲音也可以只具有極單一的頻率,譬如一個音叉發出的聲音(如果你拿起手邊的固定電話,裏面的撥號音就是一個440Hz的純音加上一個350Hz的純音,相當於音樂中的A-F和絃)。但是不確定性原理告訴我們,這兩件事情不能同時成立,一段聲音不可能既只佔據極短的時間又具有極純的音頻。當聲音區間短促到一定程度的時候,頻率就變得不確定了,而頻率純粹的聲音,在時間上延續的區間就不能太短。因此,說「某時某刻那一剎那的一個具有某音高的音」是沒有意義的。

這看起來像是一個技術性的困難,而它實際上反映出卻是大自然的某種本質規律:

任何信息的時空分辨率和頻率分辨率是不能同時被無限提高的。一種波動在頻率上被我們辨認得越精確,在空間中的位置就顯得越模糊,反之亦然。

這一規律對於任何熟悉現代多媒體技術的人來說都是熟知的,因爲它爲信號處理建立了牢不可破的邊界,也在某種程度上指明瞭它發展的方向。既然時空分辨率和頻率分辨率不能同時無限小,那人們總可以去研究那些在時空分佈和頻率分佈都儘量集中的信號,它們在某種意義上構成了信號的「原子」,它們本身有不確定性原理所允許的最好的分辨率,而一切其他信號都可以在時空和頻率上分解爲這些原子的疊加。這一思路在四十年代被D. Gabor(他後來因爲發明全息攝影而獲得了1971年的諾貝爾物理獎)所提出,成爲整個現代數字信號處理的奠基性思想,一直影響到今天。

但是衆所周知,不確定性原理本身並不是數學家的發明,而是來自於量子物理學家的洞察力。同樣一條數學結論可以在兩個截然不相干的學科分支中都產生歷史性的影響,這大概是相當罕見的例子了。

不確定性原理事實上不是一個單獨的定理,而是一組定理的統稱。基本上,凡是刻劃一個信號不能在時空域和頻域上同時過於集中的命題都可以稱爲不確定性原理,由於這裏「集中」這一性質可以有不同的數學描述,也就對應着不同的數學定理。但是在所有冠以「不確定性原理」之名的定理中,最著名的當然是海森堡(W. Heisenberg)在1927年所提出的影響物理學發展至深的那個版本。它精確的數學描述是:

假定一個信號的總能量爲1,則這個信號和它的傅立葉變換的能量的方差之積不小於1/16π2。換言之,兩者各自的能量都可能很集中,但是不能同時很集中。如果時空域中能量的方差很小(亦即集中在一起),那麼頻域上能量的方差就不會太小(亦即必然會彌散開),反之亦然。

對這個定理在量子物理中的意義的詳細討論超出了本文的話題範圍,坊間相關的著作已有不少。不過,下面簡單臚列了一些相關的歷史事實:

image

海森堡

有趣的是,即使很多信號處理或者量子力學領域的專家也不知道自己平時所討論的不確定性原理和對方的其實是一回事。這兩者之間的聯繫也的確並不太顯然,一個關注信號的時空和頻域分佈,一個關注粒子的運動和能量。它們之間的相關性只有從數學公式上纔看起來比較明顯。在海森堡的時代當然並不存在「信號處理」這一學科,數學家們也只把不確定性原理當作一條純數學的結論來對待。他們什麼時候最先注意到這一定理並不是很清楚。有記錄表明維納(N. Wiener)1925年在哥廷根的一次講座中提到了類似的結論,但是那次講座並沒有任何紙面材料流存下來。外爾(H. Weyl)在1928年名爲《羣論與量子力學》的論著中證明了這一定理,但他將之歸功於泡利的發現。直到1946年D. Gabor的一篇名爲《通訊理論》的經典論文才真正讓這個定理以今天信號處理領域的專家們所熟悉的方式流傳開來。

image

左:Weyl;右:Gabor

正如前面說過的那樣,在數學上不確定性原理不僅僅有海森堡這一個版本,而其實是一組定理的統稱。譬如哈代(G.Hardy)在1933年證明了一個和海森堡原理類似的定理,今天一般稱爲哈代不確定性原理。海森堡和哈代的定理都只約束了信號在時空域和頻域的大致分佈,而並沒有限制它們同時集中在有限大的區域內。M.Benedicks第一個證明了信號在時空域和頻域中確實不能同時集中在有限大的區域內,而這已經是1974年的事情了。

到二十世紀末,人們對「信號」這個詞的理解已經發生了微妙的變化。如果在二十世紀上半葉的時候提到一個信號,人們還傾向於將它理解爲一個連續的函數。而到下半葉,信號已經越來越多地對應於一個離散的數組。毫無疑問,這是電子計算機革命的後果。

在這樣的情形下,「不確定性原理」也有了新的形式。在連續情形下,我們可以討論一個信號是否集中在某個區域內。而在離散情形下,重要的問題變成了信號是否集中在某些離散的位置上,而在其餘位置上是零。數學家給出了這樣有趣的定理:

一個長度爲N的離散信號中有a個非零數值,而它的傅立葉變換中有b個非零數值,那麼a+b≥2√N。也就是說一個信號和它的傅立葉變換中的非零元素不能都太少。毫無疑問,這也是某種新形式的「不確定性原理」。

在上面的定理中,如果已知N是素數,那麼我們甚至還有強得多的結論(它是N.Chebotarev在1926年證明的一個定理的自然推論):

一個長度爲素數N的離散信號中有a個非零數值,而它的傅立葉變換中有b個非零數值,那麼a+b>N。不幸的是這裏「素數」的條件是必須的。對於非素數來說,第二條命題很容易找到反例,這時第一條命題已經是能夠達到的最好結果了。

這些定理有什麼用呢?如果它僅僅是能用來說明某些事情做不到,就像它字面意思所反映出的那樣,那它的用處當然相對有限。可是——這無疑是辯證法的一個好例證——這樣一系列宣稱「不確定」的定理,事實上是能夠用來推出某些「確定」的事實的。

設想這樣一種情況:假定我們知道一個信號總長度爲N,已知其中有很大一部分值是零,但是不知道是哪一部分(這是很常見的情形,大多數信號都是如此),於此同時,我們測量出了這個信號在頻域空間中的K個頻率值,但是K<N(也就是我們的測量由於某些原因並不完整,漏掉了一部分頻域信息)。有沒有可能把這個信號還原出來呢?

按照傳統的信號處理理論,這是不可能的,因爲正如前面所說的那樣,頻域空間和原本的時空域相比,信息量是一樣多的,所以要還原出全部信號,必須知道全部的頻域信息,就象是要解出多少個未知數就需要多少個方程一樣。如果只知道一部分頻域信息,就像是隻知道K個方程,卻要解出N個未知數來,任何一個學過初等代數的人都知道,既然K<N,解一定是不唯一的。

但是藉助不確定性原理,卻正可以做到這一點!原因是我們關於原信號有一個「很多位置是零」的假設。那麼,假如有兩個不同的信號碰巧具有相同的K個頻率值,那麼這兩個信號的差的傅立葉變換在這K個頻率位置上就是零。另一方面,因爲兩個不同的信號在原本的時空域都有很多值是零,它們的差必然在時空域也包含很多零。不確定性原理(一個函數不能在頻域和時空域都包含很多零)告訴我們,這是不可能的。於是,原信號事實上是唯一確定的!

這當然是一個非常違反直覺的結論。它說明在特定的情況下,我們可以用較少的方程解出較多的未知數來。這件事情在應用上極爲重要。一個簡單的例子是醫學核磁共振技術(很多家裏有重病患者的朋友應該都聽說過這種技術)。核磁共振成像本質上就是採集身體圖像的頻域信息來還原空間信息。由於採集成本很高,所以核磁共振成像很昂貴,也很消耗資源。但是上述推理說明,事實上核磁共振可以只採集一少部分頻域信息(這樣成本更低速度也更快),就能完好還原出全部身體圖像來,這在醫學上的價值是不可估量的。

在今天,類似的思想已經被應用到極多不同領域,從醫學上的核磁共振和X光斷層掃描到石油勘測和衛星遙感。簡而言之:不確定性可以讓測量的成本更低效果更好,雖然這聽起來很自相矛盾。

糟糕的是,本篇開頭所描述的那個不確定性定理還不夠強,所能帶來的對頻域測量的節省程度還不夠大。但是數學上它又是不可改進的。這一僵局在本世紀初被打破了。E.Candès和陶哲軒等人證明了一系列新的不確定性原理,大大提高了不等式的強度,付出的代價是……隨機性。他們的定理可以粗略敘述爲:

一個長度爲N的離散信號中有a個非零數值,而它的傅立葉變換中有b個非零數值,那麼a+b以極大概率不小於N/√(logN)乘以一個常數。這裏的「極大概率」並不是一個生活用語,而是一個關於具體概率的精確的數學描述。換言之,雖然在最倒黴的情況下不確定性可以比較小,但是這種情況很罕見。一般來說,不確定性總是很大。於是可以帶來的測量上的節約也很大。

這當然也是一種「不確定性原理」,而且因爲引入了隨機性,所以在某種意義上來說比原先的定理更「不確定」。在他們的工作的基礎上,一種被稱爲「壓縮感知」的技術在最近的五六年內如火如荼地發展起來,已經成爲涵蓋信號處理、信息提取、醫學成像等等多個工程領域的最重要的新興工程技術之一。

不過,這些後續的發展估計是遠遠超出海森堡的本意了。

聲明:本微信轉載文章出於非商業性的教育和科研目的,並不意味着支持其觀點或證實其內容的真實性。版權歸原作者所有,如轉載稿涉及版權等問題,請立即聯繫我們,我們會予以更改或刪除相關文章,保證您的權利!

發佈了275 篇原創文章 · 獲贊 199 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章