被大學解僱、拒絕 Facebook,語音界大佬Daniel Povey將入職中國小米

昨日,小米集團創始人雷軍在微博上宣佈,國際語音識別和AI領域專家、語音識別開源工具 Kaldi 之父Daniel Povey(下文簡稱Dan) 將出任小米集團語音首席科學家。他將在北京組建獨立研發團隊,彙報給集團副總裁、技術委員會主席崔寶秋。

對於Dan的加入,崔寶秋首先讚揚了他的工作精神,並表示,“很高興 Dan 能夠出席今年的小米開發者大會!”

Dan 也曾在個人Twitter上宣佈了這一消息,他提到將在 2019 年底動身前往北京,並將在那裏組建一個小團隊,開發新一代的“PyTorch-y” Kaldi。

加盟小米前,曾拒絕Facebook

今年8月,Dan 因一場學生鬧劇被約翰·霍普金斯大學解僱。

Dan Povey

Facebook 馬上向 Dan Povey 伸出橄欖枝,Dan 接受了。

但 Facebook 表示在學校事件調查結束前,暫時只能給 Dan 6 個月的 “合同工” 合約,調查結果出爐後纔會決定是否正式聘請。

Dan 拒絕了,並諷刺 Facebook 的所作所爲讓他感覺 “déjà vu(似曾相識)”。

Dan 隨後在個人主頁上表示,他計劃去一家中國公司工作,並且 “或許會在一所中國大學兼職”。

消息一出,國內學界業界頗爲興奮,紛紛猜測大神將去哪兒。

現在,Dan Povey 的新工作終於官宣:這家中國公司,就是小米。

Dan是什麼人?語音界傳奇,開發 Kaldi 撐起語音識別開源軟件半邊天

非語音方向的讀者可能不熟悉 Dan Povey,在語音界,Dan 可以說是一個傳奇。

Dan 是語音界赫赫有名的大佬,根據 LinkedIn 的信息,自 2012 年以來,他一直在約翰・霍普金斯大學擔任助理研究教授。在加入霍普金斯大學之前,他曾在微軟和 IBM 擔任研究員。

略掃一遍知乎上的討論,我們發現,Dan 教授在學生中有着極高的聲譽,他的一堆 “標籤” 甚至讓路人圈粉。

他曾經的學生說:“Dan 是我見過的最純粹耿直善良的 researcher,不僅學術水平極佳,至今仍居 coding 一線,靈感來了寫代碼寫到不捨晝夜,僅靠一個土豆維生。”

工作狂:Dan 是個工作狂,據稱,他每天工作 14 小時以上,除了回覆郵件,就是在寫代碼;

熱心:關心學生、主動兼任維護服務器、出來開會曾爲了幫助窮學生而 share 旅館,甚至經常給無家可歸者錢;

純粹:他的理想是 “幹掉” Nuance(一家早期非常有名的語音識別公司),給大家提供免費的語音識別工具。這讓他在並不十分美好的巴爾的摩一呆就是 7 年,全心地開發和維護 Kaldi;Kaldi 的論壇上,幾乎每個帖子都能得到回覆,Dan 回覆郵件幾乎是有求必應。

……

Dan Povey 最著名的工作是領導開發了 Kaldi,這是一個開源的語音識別工具包,在 Apache 許可下免費提供。

Kaldi 旨在爲語音識別開發者提供靈活、可擴展的軟件,支持線性 linear transforms、MMI、 boosted MMI 和 MCE 判別訓練、特徵空間判別訓練和深度神經網絡,並且已經提供 TensorFlow 集成。

關於 Kaldi 名字的來源,據說 Kaldi 是傳說中發現咖啡的咖啡之神的名字,Dan 希望工具包像咖啡那樣容易、方便、流行。

現在,Kaldi 已經成爲最廣泛使用的開源語音識別工具包之一,許多語音識別團隊都依靠 Kaldi。這套工具包自 2011 年發佈以來,下載量已經超過了兩萬多次,合著的論文目前也已經被引用一千多次。可以說 Kaldi 撐起了語音識別開源軟件的半邊天。

Kaldi 的影響是巨大的,它是第一個完全用 C++ 編寫的,基於加權有限狀態及理論的語音識別開源軟件,它的模塊化與高度可擴展性設計,詳細的說明文檔,完備公開的教程,也是它受廣大開發者喜愛的一個主要原因。

它目前被業界廣泛採用作爲標準工具,包括學術界的 MIT、CMU、GHU、劍橋,國內的清華、上海交大等等,工業界包括微軟、谷歌、IBM,Facebook 等等,它的推出也極大推進整個語音識別領域的發展。

有趣的是,Dan Povey 也是劍橋大學語音識別工具包 HTK 的作者之一,他是領導 HTK 工具包開發的 Phil Woodland 教授的學生。經過若干年的發展,Kaldi 集成的技術已經多於 HTK,老師開發了第一代語音識別開源軟件,學生開發了第二代語音識別開源軟件。

一場學生鬧劇令語音大牛遭解僱:教授深夜闖入,只爲奪回服務器

語音界大佬憤而出走,怒拒 Facebook轉投中國,緣起於一次 “爲了奪回服務器” 的反抗,以及因此發生的一場鬧劇式的解僱風波。

事情生在 5 月 7 日的午夜,Dan Povey 帶着一把斷線鉗,試圖趁着夜黑風高闖入約翰霍普金斯大學被抗議的學生佔領的行政樓,奪回 CLSP(語言語音處理中心)維護的服務器的控制權。

約翰霍普金斯大學被學生佔領的 Garland Hall 外牆

在這之前,行政樓 Garland Hall 已經被靜坐抗議的學生佔領長達 34 天,他們將窗戶封緊,大門用鐵鏈鎖上。

但 Dan 負責維護的 CLSP 的服務器在大樓裏,在試圖向學校申請進入大樓維護服務器無果之後,他決定阻止這場抗議。

Dan 以工作狂聞名,他的學生 Guoguo Chen 在知乎上說:“這麼些年和 Dan 接觸下來,感覺有兩個點是不能觸碰的,一個是時間,一個是服務器。”

Guoguo Chen 說:“Dan 還有一個不能接受的便是服務器的不穩定。Dan 在很多事情上都比較寬容,但是如果誰亂用了服務器的資源,會收到 Dan 非常嚴厲的警告。Dan 覺得數據和計算資源,對整個 CLSP 來說,都是非常非常重要的資產,需要隨時保證 CLSP 的每一個人都可以使用到。我相信這也是爲什麼 Dan 在這次事件中,會試圖奪回服務器,避免數據和及其資源的損失。”

根據當地報紙的報道,那天夜裏,在其他六名 “社會閒散人士” 的陪同下,Dan 攜帶鉗子前往大樓,費力地試圖剪斷抗議學生在門上綁的鐵鏈,奪回服務器的控制權。

視頻拍攝到 Dan 被學生們推出大樓

但他失敗了。隨即引發了肢體衝突,Dan 被學生們推擠出大樓。Dan 在他的網站上解釋,強行進入大樓是因爲研究用的服務器故障,而該服務器在學生佔領的大樓內。

“奪回服務器” 事件後,Dan 先是被停職,隨後在 8 月 8 日,被校方以 “危害學生安全” 爲由解僱。

Dan 公開了這封解僱信,並說他會提前離開。他在自己的網站上辯護說:“或許我失去了工作,但至少我依舊保有尊嚴和獨立的思想。”

他說,自己被炒魷魚是因爲他是白人男性,而抗議的學生是少數族裔。在個人主頁的陳述中,他寫道:“對於美國人及美國各類機構而言,似乎沒什麼比被指控種族主義(或類似主義)更可怕的了。這導致了我們這裏看到的荒謬的事實:如此巨大的機構竟因幾個被蠱惑的孩子陷入癱瘓。”

他表示自己有很多出路:“我告訴朋友,再不濟我就到中國或者俄羅斯去。但我要告訴各位,不論發生什麼,我永遠不會道歉,不會退縮。”

在公開信中,他寫道:

最後,我留下幾句鮑勃·迪倫的歌詞:

我不對我做的任何事感到遺憾

我很高興我戰鬥了,我只希望我們勝利

被學校解僱,拒絕Facebook後,爲什麼是小米?

這樣一位大牛,爲什麼選擇小米呢?10月23日,小米在人工智能媒體開放日活動中分享了是怎麼挖到Dan的。

Povey 被約翰霍普金斯大學開除後,小米人工智能部門語音組的負責人看到了Dan在 Twitter 上發佈的“拒絕 Facebook”的帖子,便轉給了小米集團人工智能部總經理葉航軍博士。負責國際招聘的同事便立即與 Dan 聯繫,收到回信後,葉航軍博士便與其溝通小米的戰略佈局和技術問題。

隨後,小米技術委員會主席的崔寶秋與 Dan 進行了進一步的溝通,併成功將人挖來了小米。崔寶秋曾對媒體談到,Dan 之所以選擇小米有三點原因,一是小米的 AIoT 生態,二是小米對自研技術和人才的重視,三是小米對開源的擁抱。

其中小米的開源戰略是吸引 Dan 的一個關鍵點,崔寶秋談道,他在給 Dan 的 3 個 PPT 中專門介紹了小米對開源的擁抱。其中一個 PPT 談到將來的計劃,有一個就是要聯合中國的互聯網企業技術企業,來把中國的開源力量推向世界。 Dan 將這句話專門標出來,說這就是他想做的。

另外,從小米業務來看,雷軍曾提出小米未來五年的“雙引擎”是手機+AIoT,其中 AIoT 是 AI 和 IoT 的結合,可見人工智能在小米整體戰略的重要性。小米在AI領域取得了亮麗的成績。公開數據顯示,2016 年到 2018 年間,小米在AI領域申請專利達到 684 項,列居世界第 11 位,成了國際領先的 AI 新勢力。

同時,小米在聲學、語音、視覺、自然語言處理、知識圖譜和機器學習這 6 大方向都有相應的研發團隊。目前在語音方面已經推出了落地產品,技術上也有所突破。

如不久前在備受業界關注的“AISHELL Speaker Verification Challenge 2019遠場語音說話人識別挑戰賽”中,小米語音團隊採用的多維度數據增廣+經典識別模型+深度神經網絡嵌入的融合方法,在近場註冊Track1和遠場註冊Track2兩個任務均獲得了全國第一名。

重視語音技術研發的小米和語音識別大佬的聯合,會帶來什麼影響呢?對此,有網民認爲,“長遠看的話,會對小米科研實力提升有所幫助,期待小愛同學還有小米在未來AI領域的發展”。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章