NLU 不是 NLP++

譯自 Walid Saba

隨着自然語言處理中各個榜被不斷刷新,所謂的“超越人類“也已實現。人們感到的是什麼,是滿足嗎?是得意嗎?從此以後就可以安逸了嗎?

並沒有,人們反而發現,這些所謂“超越人類“的模型,可能一點都沒有理解人類的語言。像 Bert 這樣的刷榜模型,更像是大力出奇跡。這時,開始跳出一些人,對這些現象進行反思,爲什麼呢?我們走的這條路到底是不是正確的?還是說如果要摘下 NLP 這顆人工智能皇冠上的寶珠,還需要其他一些方法呢?

最近很多研究人員都發表了自己的看法,比如 EMNLP 上關於 NLG 的講座,還有最近 Bengio 在北大的演講中,提到了世界模型,其實和這篇也有很大的關係。

感覺這篇言辭還是非常尖銳的,我自己都看得汗顏,被戳中很多點,更別說那羣思想家和邏輯學家了,聞所未聞。不過後面提到的例子裏,也確實很有參考的價值。

我在其他很多地方都提到過,現在很多所謂的自然語言處理(NLP)“專家”,可能對很多語言理解難題聞所未聞,比如說內涵性,名詞性複合詞,轄域歧義,含糊語境等等。他們也沒了解過 Gottlob Frege,Bertrand Russell,Ludwig Wittgenstein,W. V. O Quine,Rudolph Carnap 等人幾個世紀前的工作,更別說最近的思想家如 Richard Montague,Jon Barwise,Hans Kemp, Jerry Fodor,George Lakoff,Jerry Hobbs 等人的工作。這看起來就像,從來沒聽說過熱力學第三定律的專業物理學家。

這聽起來很蠢,很悲哀:所謂的 NLP 專家,他們唯一技能就是知道如何調用機器學習庫,處理數據,訓練一些模型,然後就可以獲得一個“理解”語言的系統。而產生這些效果的,也只是因爲數據是 BIG(大) 的,模型是 DEEP(深) 的。然而,理所當然的,沒有任何一個“大”的或“深”的模型,能很好地理解一個簡單的句子,一個對於4歲小孩,都能輕而易舉說出或毫不費力理解的句子。

然而,這裏真正的問題是,這種天真的看法,卻並不僅僅流行於被媒體炒作給洗腦的新畢業生們(順帶一提,他們大部分都沒有堅實的科學基礎!),這種看法甚至流行於所謂的NLP專家(那些創造並延續炒作的人),這其中包括今天人工智能的一些“搖滾明星“們(“大”和“深”解決一切的原始支持者們)。

我特別關注的是 NLU(重點'U', Understanding),即自然語言理解,而不是語言“處理”。因爲在一段文本中查找命名位置的數量,或是“蘋果”周圍詞的數量,還有“特朗普”出現在標題中的次數,亦或者一些詞之間的分佈和統計相關性等等等,這些都是某種形式的語言處理。但是,理論上所有這些都和在圖像中找到具有 RGB 顏色值(220,0,117)的像素的數量,屬於同種計算問題。

而這些文本,是由英語還是中文或其他語言組成就是次要的了。然而,理解語言其實是個完全不同的問題,它不僅僅是一個加強版的 NLP; 它實際上是一個完全不同的領域或研究,需要除語言學,語法之外各種不同的基礎知識。語言即思想,在字面上,我甚至建議用 HTU 代替 NLU(Human Though Understanding,“人類思想理解”),以便將其與純粹的文本處理區分開來

要明白這一點,可以看看下面這個例子:

(1)球不能裝進這個灰色的箱子裏,因爲它太

a. 小了

b. 大了

對於這個,就連一個四歲小孩(我的一個朋友還跟我說他兩歲半的兒子都能)都可以毫不費力的明白,如果答案是 a 的話,那麼“它"指的就是箱子,而如果是 b 的話指的就是球。

當然,人們也可以通過改變一個單詞來輕鬆改變這些常識性偏好。例如,將“因爲”替換爲“雖然”,或者將“不”代替成“確實”,或是這些的任意組合,從常識的角度來看的話,這將會改變整個“合理性空間“。

如果堅持將人類這種語言看做是字符(“數據”)的話,那麼影響這個簡單模式中“它”所指的組合數量就超了4000萬種(相當於正常人一生中所聽到過的句子的一半之多!)。因此,在數據上進行訓練來學習模式的做法是荒謬的。

另一方面,一個4歲的孩子,即使他們只聽過幾個相似的句子,也能理解“它”是指什麼,因爲他們知道這些物體在我們生活的世界中如何運作,以及它們如何相互關聯。簡單來說,因爲他們有常識。這是另一個(非常嚴重的)問題,即所謂的NLP專家忽視(或者甚至不知道這個問題存在?)。考慮下圖中的情況

在數據驅動的方法中,人們會很容易地替換掉現實,並做出錯誤的推論。比如在“我看到瑪麗在教她弟弟 7 + 9 = 16”的中,用一個等價的值替換掉 16(數據等同,但現實幾乎不可能),比如說256取平方根 sqrt(256); 替換之後,其實我們很明顯能看出來,“我看到瑪麗教她弟弟 7 + 9 = 16” 與 “我看到瑪麗教她的弟弟7 + 9 = sqrt(256)” 是不一樣。在現實生活中,雖然前者是真的,但後者卻不是(這是語言理解所需要的高級推理,這裏你的高中老師是錯的,sqrt(256)= 16 並不總是正確的!)。

簡而言之,雖然文本的語法和語義分析在 NLP 中可能具有挑戰性,但在自然語言理解(NLU)中實際上是微不足道的部分; NLU的嚴峻挑戰在於,它與我們思考的形而上學的現實及其本體論結構,以及一般的推理和人類認知相相關所導致。

如果你對這些並不感興趣,那麼在文本處理(分類,過濾,搜索等)中還有很多工作你可以去做。但如果你對語言理解的問題感興趣的話,那麼深入瞭解 NLU 的複雜性,以及最傑出的邏輯學家和認知科學家幾個世紀以來所做的工作將會是一條很長的路。然後,通過各種方式,利用那些“大”的數據,並做你喜歡的那些“深”的東西。之後,我將期待看到你做出的突破!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章