Hulu全球研發副總裁諸葛越談人工智能

馬上要進入新的招聘季。對於有志投身技術領域的應聘者,面對當下正席捲全球的人工智能熱潮,“數據科學家”和“算法工程師”絕對算得上熱門職業。“人工智能”“機器學習”“深度學習”“建模”“卷積神經網絡”等關鍵詞,不僅是人們茶餘飯後的談資,而且更會成爲軟件工程師的必備技能。

 未來幾年人工智能技術無疑將全面普及,同時相關人才稀缺。不少學習計算機的在校學生或者已經有一定工作經驗的軟件工程師,都希望趕在人工智能徹底佔領世界之前,自己能駕馭相關領域的技術,成爲有力的競爭者。Hulu全球研發副總裁諸葛越一直深耕於人工智能領域,她在擔當主編的《百面機器學習:算法工程師帶你去面試》一書(已開啓全網預售)中,談到自己人工智能專業的學習經歷和對人工智能領域的行業認識,希望以下她的經驗分享能帶來啓發。

諸葛越,《百面機器學習》主編。現任Hulu全球研發副總裁,中國研發中心總經理。畢業於清華大學計算機科學與技術系,美國斯坦福大學計算機碩士與博士,紐約州立大學石溪分校應用數學碩士。

諸葛越:我與人工智能

我的本科專業是人工智能,所以本科我就接觸到許多當時人工智能領域的前沿技術。我的人工智能入門課的導師是林堯瑞教授,也是《人工智能導論》的作者。在本科四年級的時候,我有幸進入了清華大學的人工智能實驗室,師從張鈸老師,做一些簡單的研究。從張老師和高年級的同學們那裏,我學到人工智能領域不少當時國際先進的知識。

我剛剛進入斯坦福的時候,去聽一個小型的午餐講座(Brown Bag)那位同學講到一半,教室門突然被打開,大鬍子的約翰·麥卡錫(John McCarthy)教授走了進來,大聲地問:“聽說這裏有不要錢的午飯?” 然後他走到房間的前面,抓了兩個三明治,大搖大擺地走出去了。主持講座的老師愣了一下,說:“歡迎大家來到斯坦福——世界上最著名的科學家會走進你們的教室來搶你們食物的地方!”“人工智能”(Artificial Intelligence)這個詞,就來自約翰·麥卡錫。

我在斯坦福還還去學了一次人工智能課CS140。當時教這個課的尼爾斯·尼爾森(Nils Nilsson)教授是另外一位人工智能的學科創始人和世界級專家。尼爾森教授的課非常有趣,我還跟他做了一個小的項目,規劃一個掃地機器人的路徑。至今,我還保留了這門課的筆記。

說實話,我年輕的時候每天做作業、做課題,沒有意識到能和這些頂級科學家同堂是多麼幸運,也未必知道自己正在見證某個技術領域的世界前沿。最頂尖的技術,開始都是隻有小衆才能理解和欣賞的。現在看來,我這幾次和人工智能以及人工智能大咖的偶遇,剛好和人工智能的三次浪潮有關。

人工智能的三次浪潮

第一次人工智能浪潮大約在20世紀50年代。1956年達特茅斯的人工智能研討會上,約翰·麥卡錫正式提出“人工智能”這個概念,被公認是現代人工智能學科的起始。麥卡錫與麻省理工學院的馬文·明斯基(Marvin Minsky)被譽爲“人工智能之父”。

在計算機被髮明的早期,許多計算機科學家們認真思考和討論過這個人類發明的機器和人類有什麼根本區別。最初那批思考人工智能的專家,從思想和理論上走得非常前沿,看到了計算機的潛力。這個階段的許多基礎理論,不僅是人工智能的基礎理論,也是計算機專業的基石。

第一次人工智能的浪潮主要是基於邏輯的。1958年麥卡錫提出了邏輯語言LISP。20世紀50年代到20世紀80年代,研究者們證明了計算機可以玩遊戲,可以進行一定程度上的自然語言理解,發明了神經網絡,可以做簡單的語言理解和物體識別。

然而,在人工智能的前二三十年裏,它雖然是一個碩果累累的科研領域,卻因爲缺乏應用而在20世紀80年代初進入“冬季”。到80年代末和90年代初,人工智能科學家們另闢蹊徑,從解決大的普適智能問題,轉向某些領域的單一問題。計算機技術經過了30年左右的發展,數據存儲和應用有了一定的基礎,研究者們看到人工智能和數據結合的可能性,提出了“專家系統”這個概念,看病、預報天氣等各行各業的專家系統,帶來了有希望、有意義、有實際的應用場景,讓這些研究成果找到了第一個可能的商業出路。這是人工智能的第二次浪潮

然而,比較有意思的是,當我們想要用這些專家系統來做一些聰明的診斷的時候,我們發現遇到的問題並不是如何診斷,而是當時大部分數據還不是數字化的。病人的診斷歷史還停留在看不懂的醫生手寫處方上。就算有些信息已經開始數字化,也都是在一些表格或者是在一些不互相連接的機器裏面,拿不到也用不了。於是,想去做自動診斷的人,反而去做了一些把世界上所有信息數字化的基礎的工作。

在一批人致力於把世界上每一本書、每一張圖、每一個處方都變成電子版的時候,互聯網的廣泛應用又把這些信息相互聯接了起來,成了真正的大數據。同時,摩爾定律(Moore’s law)預測的計算性能增加一直在起作用。隨着計算能力的指數增長,那些只能在實驗室裏或有限場景下實現的應用,離現實生活越來越近了。

第三次的人工智能浪潮是基於巨大的計算能力和海量的數據的大發展。巨大的計算能力來自於硬件、分佈式系統、雲計算技術的發展。最近,專門爲神經網絡製作的硬件系統(neural-network-based computing)又一次推動了人工智能軟硬件結合的大進步。海量的數據來源於前幾十年的數據積累和互聯網技術的發展。計算能力和數據的結合,促進、催化了機器學習算法的飛躍成長。

這次的人工智能浪潮起始於近10年,和前兩次最基本的不同是它的普遍應用和對普通人生活的影響,人工智能離開了學術實驗室,真正走進大衆的視野。

人工智能全面逼近人類能力?

爲什麼這次人工智能浪潮如此兇猛?人工智能真的全面逼近了人類的能力嗎?人工智能技術現在發展到什麼階段?我們來看3個簡單的事實。

第一個事實是,歷史上第一次,計算機在很多複雜任務的執行上超過人類或者即將超過人類,如圖像識別、視頻理解、機器翻譯、汽車駕駛、下圍棋等。所以,人工智能取代人類的話題開始出現在各種頭條。

其實在單一技術方面,許多計算相關技術早已超過人類而且被廣泛應用,比如導航、搜索、搜圖、股票交易。但這些都主要是“完成一個任務”,計算機沒有過多地涉獵人的感知、思考、複雜判斷和和情感。

而近幾年來機器完成的任務,從複雜性和形式越來越逼近人類。比如,基於機器學習的自動駕駛技術趨於成熟,這不僅會對人們的出行方式有革命性的影響,而且會影響到城市建設、個人消費、生活方式。大家對這類新技術的快速到來既興奮又恐懼,一方面享受其其帶來的便利,另一方面對太快的變化又有些手足無措。

另外,計算機的自學習能力不斷增強。現代機器學習算法,尤其深度學習類機器學習算法的發展,使機器的行爲不再是相對可預測的“程序”或者“邏輯”,而更像“黑盒思考”,有了近乎人類的難以解釋的思考能力。

第二個事實是,仔細看來,雖然不少特殊領域中,人工智能有了突飛猛進的發展,但是距離人工智能的鼻祖們在第一次浪潮時研究的通用智能其實還相差甚甚遠。機器還是被放在特定情況下完成特定任務,只不過任務更復雜了。機器還是缺少一些最基本的人的智能,人工智能仍然無法理解哪怕是簡單的情感,對兩三歲的孩子來說非常簡單的幫忙、合作,機器都做不到。

第三個事實,是這次人工智能和機器學習的應用場景非常寬廣。近幾年人工智能和機器學習應用的大發展,讓讓曾經是學術研究領域的概念進入大衆視野,成爲和未來相關的必談話題。算法類的應用走出學術界,深入社會的各個角落,滲入人們生活的方方面面。大家熟知的有人臉識別、自動駕駛、醫療診斷、機器助手、智慧城市、新媒體、遊戲、教育等,還有並不常被談論的比如農業生產的自動化、老人和兒童的護理、危險情景的操作、交通調度,等等。浪潮波及社會方方面面。

向前看十年,人工智能和機器學習的大發展,在於這些技術的普及和應用。大批的新應用將會被開發,人工智能基礎設施會迅速完善,原有的傳統軟件和應用需要被遷移使用新的算法。所以,現在是成爲一個人工智能和機器學習專家的良機。

成爲人工智能新一代技術的“弄潮兒”中的一員需要做哪些準備?也許《百面機器學習》這本書,可以幫你向前一步。這本書的內容由簡至繁依次展開,涵蓋了機器學習各個實用領域,並採取舉例和問答的形式,生動活潑。幫助你成爲更好的算法工程師、數據科學家和人工智能的實踐者。

如何閱讀《百面機器學習》

本書信息量很大,涉獵人工智能和機器學習的各個子領域。不同公司、業務、職位,可能用到不同的技能。所以關於閱讀這本書,有以下幾個建議。

順讀法:從頭至尾閱讀。讀懂全部內容,所有的題目都會解答。

由簡至難法:每道題的旁邊都標明瞭難度。一星最簡單,五星最難。在本書中,還提供了一個題目的列表。一顆星的題目,主要是介紹基本概念,或者是爲什麼要做某一件事。如果你是機器學習的入門學習者,可以從背景知識和簡單的題目出發,循序漸進。

目標工作法:不是所有的公司、所有的職位都需要懂得各類算法。如果你目前的工作或者想去的工作在某個領域,它們可能會用到某幾類算法。如果你對某個新的領域很感興趣,那你可以專攻這些章節。無論用哪類算法,特徵工程、模型評估等基本技能都是很重要的。

互聯網閱讀法:一本書很難把廣泛的領域講得面面俱到,題目和解答可以舉一反三有很多花樣。所以,我們在很多章節後都有總結和擴展。對某個領域感興趣的朋友們,可以以這本書爲起點,深入到擴展閱讀,成爲這一方面的專家。

老闆讀書法:如果你是一個技術管理者,你需要解決的問題是算法可能對你現有的技術體系有什麼幫助,和怎麼找到合適的人,幫你做出智能的產品。建議你可以粗略地瀏覽一下本書,瞭解機器學習的各個技術領域,找到合適的解決方案。然後,就可以用本書作面試寶典了。

 人工智能和機器學習的算法還在日新月異地發展中,讓我們一起跟上這個技術領域的進步步伐。祝大家都能在這個激動人心的技術新時代更上一層樓。

《百面機器學習:算法工程師帶你去面試》

諸葛越 主編,葫蘆娃 著

人工智能領域正在以超乎人們想象的速度發展,本書趕在人工智能徹底佔領世界之前完成編寫,實屬萬幸。

書中收錄了超過100道機器學習算法工程師的面試題目和解答,其中大部分源於Hulu算法研究崗位的真實場景。本書從日常工作、生活中各種有趣的現象出發,不僅囊括了機器學習的基本知識,而且還包含了成爲優秀算法工程師的相關技能,更重要的是凝聚了筆者對人工智能領域的一顆熱忱之心,旨在培養讀者發現問題、解決問題、擴展問題的能力,建立對機器學習的熱愛,共繪人工智能世界的宏偉藍圖。 

“不積跬步,無以至千里”,本書將從特徵工程、模型評估、降維等經典機器學習領域出發,構建一個算法工程師必備的知識體系;見神經網絡、強化學習、生成對抗網絡等最新科研進展之微,知深度學習領域勝敗興衰之著;“博觀而約取,厚積而薄發”,在最後一章爲讀者展示生活中各種引領時代的人工智能應用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章