四個問題，Yoshua等27位前沿研究者，這是一份NLP領域的請回答2018

Yoshua Bengio

1.你認爲目前NLP面臨最大的三個問題是什麼？

基礎語言學習，即共同學習世界模型以及如何用自然語言處理中引用模型；
在深度學習框架內融合語言理解和推理；
常識的理解，只有解決了上述兩個問題，才能解決常識問題。

2.哪些因素讓這個領域走向了錯誤的方向？

是貪婪。

我們總是在意短期回報，我們總是想辦法利用一切我們可支配的數據訓練模型，然後希望模型能夠智能的理解和生成語言。但是，如果我們不能建立世界模型，不能深層次的理解世界是如何運作的，我們永遠不會找到智能語言的祕密，即使我們設計的神經網絡模型有多麼精巧。因此，我們必須要緊牙關，致力於用NLP解決AI，而不是孤立的理解自然語言處理。

4.你對研究生開始他們的NLP項目有什麼建議？

廣泛閱讀，不要侷限於閱讀NLP論文。閱讀大量機器學習，深度學習，強化學習論文。博士學位是一個人一生中實現追求目標的大好時機，即使是朝着這個目標邁出一小步也是值得珍惜的。

Kevin Gimpel

1.你認爲NLP目前最大的三個問題是什麼？

最大的問題與自然語言的理解有關，即使在生成任務中，所有的挑戰都可以這麼理解：計算機不理解文字對人的作用是什麼。

設計的模型應該像人類那樣閱讀和理解文本，通過形成文本世界的表示法，包括對象、設置、目標願望、信念等要素。當然，還要有人類理解文字背後所需的其他因素。

在設計出理想模型之前，所有的進步都基於提高模型模式匹配的能力。模式匹配對於開發和改善產品是有效的。我不認爲僅僅需要模式匹配就能產生一臺“理性”機器。

過去十年中，在NLP方面，最有影響力的一部作品是什麼？

《自然語言處理幾乎從零開始（Natural Language Processing (Almost) from Scratch）》，這一論文由 Ronan Collobert、Jason Weston、Leon Bottou、Michael Karlen、Koray Kavukcuoglu和 Pavel Kuksa等人合力完成，並在2011年發表。簡單來說，它以Colobert和Weston在2008年的一篇論文爲基礎，但對其進行了擴展與發揮。該論文介紹了當前NLP設計常見的幾種方法，例如，使用神經網絡進行NLP多任務學習、使用未標記數據進行預訓練詞嵌入等等。

是什麼原因導致我們踏進了自然語言處理的“陷阱”

我認爲是當前NLP傳統的處理方法，例如採用的傳統的監督學習，其中有一條假設是，測試數據與訓練數據服從相同的概率分佈，這與現實實際完全不符合。至少，真實的測試數據與訓練數據在時間上的分佈是不同的，有時甚至是幾十年的差距！所以，我們應該致力於域外學習，時間遷移等。

傳統的無監督學習和傳統的監督學習都是不現實的，所以很高興看到NLP研究人員最近關注混合使用，無論給它們起什麼名字，半監督也好，弱監督也可，它們都是一種混合的設置。

你對NLP的研究生現在開始他們的項目有什麼建議？

不要害怕創新，要勇於嘗試新鮮事物。通常來說，風險越大，收益也越大。如果失敗了，或者說不符合預期，你也可能在過程中學到許多非常有趣的事情，非常有可能爲你發表論文積累材料

四個問題，Yoshua等27位前沿研究者，這是一份NLP領域的請回答2018

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

使用densenet 實現的識別字符序列圖片附代碼鏈接

使用pytorch adam算法擬合正態分佈曲線

六種人體姿態估計的深度學習模型和代碼總結

出家如初，成佛有餘

終於，「最近鄰搜索」有通用方法了

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結