AI週報:Tumblr 用戶控訴TensorFlow不如PyTorch;2019全球AI報告:每天2億美元投入AI領域,1/10砸向自動駕駛;紐約大學開發出BLiMP,可測試BERT和GPT-2等語言模型

資訊

Tumblr 用戶控訴TensorFlow“太糟糕”,認爲PyTorch更好用

近日,一位Tumblr用戶控訴谷歌的TensorFlow有點讓人摸不着頭腦,用起來也有不夠順手。他在發文中提到,TensorFlow的代碼有點冗雜,但是谷歌依然不斷地爲軟件發佈新特性,最終導致軟件更加難於理解和使用。

開發者列出了TensorFlow一系列使用缺陷,“知道它在某些方面讓我想起了什麼嗎?在出現大量向後不兼容新特性後,好不容易剛剛掌握了特定平臺的相關知識後,這種知識又將在兩年內被淘汰,這的確會讓人沮喪,”Tumblr這樣用戶寫道。

隨着人工智能逐漸步入工業化階段,越來越多人將使用軟件來開發人工智能,而能吸引最多開發者的軟件將可能成爲類似Linux這樣的新計算實現的基礎。所以,人們對TensorFlow的抱怨與對PyTorch的欣賞就形成了鮮明的對比。Facebook開發的PyTorch人工智能軟件框架顯然要比TensorFlow更容易使用,也更加靈活。

紐約大學研究員開發出BLiMP,用於測試BERT和GPT-2等語言模型

過去幾年,像BERTGPT-2這樣的大型語言模型顛覆了自然語言處理的研究,在短時間內取得了巨大突破。目前,紐約大學研究員開發了一款能幫助人們更容易對比不同模型性能的benchmark,這款benchmark可以比較出不同模型的優缺點,同時還能將語言模型與人類表現進行對比。

該benchmark被稱爲BLiMP,是“語言最小對立組benchmark”的縮寫。BLiMP測試了語言模型如何根據不同的標準對不同的句子進行分類,測試涉及了12種語言現象,包括省略、主謂一致、不規則形式等。BLiMP也提供了人類基準線,幫助我們根據絕對得分和相對錶現來比較語言模型。BLiMP完整數據集由67個分類(1000個句子對)組成,每個分類屬於12種語言現象中的一種。

“我們評估的所有模型都遠低於人類的表現”,研究人員這樣寫道。“GPT-2表現最好,在某些語法現象上和人類表現平分秋色(甚至幾乎超越人類),但是整體表現比人類低8%。”需要注意的是,作者僅測試了中型版本的GPT2(對比7.75億參數的大版本和15億參數的XL超大版本來說,3.45億的版本就是中型版本),所以姑且可以認爲其他版本的性能會更好一些。通過對比發現,Transformer-XL、LSTM和5-gram表現更差。

他們寫道,BLiMP可以“作爲作爲benchmark對新語言模型的總體表現進行評估”。此外,由於BLiMP測試可以適用於不同的語言現象中,因此可利用它詳細對比不同模型之間的差異和優劣。

2019 年 ACM Fellow 公佈:阿里平頭哥首席科學家謝源等 7 位華人當選

紐約時間 12 月 11 日,美國計算機學會(ACM)宣佈 2019 年新當選 ACM Fellow 名單,共有 58 位科學家當選,其中包括有阿里平頭哥首席科學家、達摩院高級研究員謝源在內的 7 位華人學者。這 7 位華人學者分別是陳熙霖、李向陽、呂鬆武、陶大程、謝源、周禮棟、Dawn Song,來自人臉識別、物聯網、蜂窩網絡、分佈式計算、安全和隱私等不同研究領域。ACM Fellow 用於表彰在計算機和信息技術領域從業五年以上,並做出”突出貢獻“(Exceptional Contributions)的科學家,只有 1% 的 ACM 會員有機會當選。

ACM 創立於 1947 年,目前在全世界 130 多個國家和地區擁有超過 10 萬名會員,是世界上最大的教育和科學計算機協會,其所評選的圖靈獎被譽爲”計算機界的諾貝爾獎“。ACM Fellow 計劃於 1993 年啓動,旨在表彰計算領域領先成員的傑出貢獻,截止目前已有 1000 多位 ACM Fellow 誕生。本次選出的 58 名 ACM Fellow 分別來自澳大利亞、加拿大、中國、埃及、法國、德國、以色列、意大利、瑞士和美國的大學、公司和研究中心。

谷歌助理現能在智能手機上翻譯 44 種語言

在今年一月的拉斯維加斯消費電子展期間,谷歌首次推出了“口譯員模式”,這是一種實時翻譯功能,適用於 Google Home 揚聲器和第三方智能顯示器(例如索尼,LG 和聯想)。當時,這家科技巨頭表示,解釋器模式最終會出現在移動設備上。

該功能於12月13日正式上線。自13日一早開始,Android 和 iOS 智能手機上的 Google Assistant 都支持口譯員模式,用戶可以通過它詢問路線、點菜或用外語聊天等。其可以識別的語言數量從之前的 27 種增加到了 44 種,包括希臘語、土耳其語和漢語等。並且現在在解釋器模式下,用戶可以選擇使用鍵盤輸入文字或手動選擇他們要說的語言。

微軟首款 Office 應用程序登陸 Linux

今年 9 月時,微軟曾確認正在爲 Linux 構建 Teams 客戶端。時隔兩個多月,微軟在官方博客中宣佈 Microsoft Teams 已在 Linux 上公開預覽,並可下載使用,該本地軟件包有 .deb 和 .rpm 兩種格式以供選擇。

Microsoft Teams 客戶端是微軟引入 Linux 的首款 Office 365 應用程序,它是一款集成的辦公軟件,提供即時聊天、視頻會議、文件共享等功能,使團隊能夠輕鬆協作。Teams 是微軟有史以來增長最快的業務應用,根據微軟上個月公佈的數據,該應用每天有 2000 萬活躍用戶。

微軟承諾,此次的 Linux 版本也將同樣支持 Teams 的所有核心功能。不過它現在仍處於公開預覽狀態,也就意味着部分功能可能暫時無法使用或無法正常工作。微軟工作人員告訴外媒 VentureBeat:“會議中有一些與 Office 應用和屏幕共享/控制相關的功能,在 Linux 中尚不可用”。同時微軟也表示將根據社區的反饋進一步做出改進,期待用戶下載並提交使用反饋。

《斯坦福2019全球AI報告》:每天2億美元投入AI領域,1/10砸向自動駕駛

由斯坦福大學發起的人工智能指數(AI Index)是一個追蹤 AI 動態和進展的非營利性項目,旨在全面研究 AI 行業狀況,目標是促進基於數據的 AI 的廣泛交流和有效對話。12月12日,AI Index 發佈了 2019 年度報告。《報告》顯示,2019年,全球私有AI投資超過700億美元,相當於每天2億多美元砸向AI領域。此外,自動駕駛汽車在過去一年中獲得了全球投資的最大份額(77億美元),其次是AI醫療(47億美元)、面部識別(47億美元)、視頻內容(36億美元)和欺詐檢測和金融(31億美元)。

量子計算機實用重要里程碑!英特爾發佈首款低溫控制芯片Horse Ridge

英特爾研究院發佈了代號爲“Horse Ridge”的首款低溫控制芯片,以加快全棧量子計算系統的開發步伐。作爲量子實用性道路上的一個重要里程碑, Horse Ridge實現了對多個量子位的控制,併爲向更大的系統擴展指明瞭方向。

基於英特爾22納米FinFET技術,英特爾與QuTech(由荷蘭代爾夫特理工大學與荷蘭國家應用科學院聯合創立)共同開發了Horse Ridge。控制芯片的製造在英特爾內部完成,將極大地提高英特爾在設計、測試和優化商業上可行的量子計算機的能力。

英特爾量子硬件總監Jim Clarke 表示:“雖然人們非常重視量子位本身,但同時控制多個量子位仍是業界的一大挑戰。英特爾認識到,量子控制是大規模商用量子系統開發過程中的核心環節,這也是英特爾投資量子糾錯和控制技術的原因。通過Horse Ridge,英特爾開發了一個可擴展的控制系統,能夠大大加快測試速度並實現量子計算的潛力。”

谷歌推出改進版文本分類和模型訓練的 AutoML 自然語言

今年早些時候,谷歌完成了其 AutoML 自然語言的收尾工作,這是其 Cloud AutoML 機器學習平臺向自然語言處理領域的擴展。經過長達一個月的測試後,AutoML自12月13日起開始向全球客戶開放,支持分類、情感分析和實體提取等任務,以及一系列文件格式—包括本機和掃描的 PDF。

AutoML 自然語言可以利用機器學習來揭示電子郵件、聊天記錄、社交媒體帖子等中文本的結構和含義。它可以從上傳和粘貼的文本或谷歌雲盤文檔中提取有關人員、地點和事件的信息,並且允許用戶訓練自己的自定義 AI 模型來分類,檢測和分析諸如情感,實體,內容和句法等。此外,它還提供自定義實體提取功能。

聲音

軟銀中國華平:圍繞AI智能化、醫療健康、新材料進行投資

在第十九屆中國股權投資年度論壇上,軟銀中國資本管理合夥人華平表示,軟銀中國仍將主要圍繞科技型企業投資,他提到三大領域:AI智能化、醫療健康、新材料。關於AI智能化,華平認爲,雖然大家在這方面已經講了很長時間,但從概念到真正改變行業,實際上還是剛剛開始。同時,ToB也一直是軟銀中國在投資上大的方向。未來,“還會持續在這裏面再加碼”。

軟銀中國資本管理合夥人華平

從宏觀角度來看,華平認爲,圍繞科技創新的投資一定會升溫,在行業所佔的比重會越來越大。同時他指出,有兩方面因素會推動這種變化到來。首先,是中美之間貿易的討論。這意味着國內一定會培養很多的高科技企業,形成擁有自己豐富核心技術的產業鏈;再者,科創板到目前爲止健康運營,已經上市幾十家公司,可以縮短投資科技型企業的退出週期,也會讓大家更願意去投資科技型企業。

AI開源工具

Multi Model Server

Multi Model Server(MMS)是一個靈活且易於使用、用任何ML/DL框架都可進行深度學習模型訓練的工具。使用MMS Server CLI或預配置Docker圖像來設置HTTP端點來處理模型推理請求。

https://github.com/awslabs/multi-model-server

ergo
ergo是從拉丁語“我思故我在 Cogito ergo sum”中而來,這是一款能讓Keras機器學習更加簡單的命令行工具。它可以:
· 用最少數量的代碼在數秒內構建新項目;
· 編碼樣本、導入和優化CSV數據集並且用這些來訓練模型;
· 在訓練中可視化模型結構、損失和精準函數;
· 藉助差分推理決定每個輸入特徵如何影響精準度;
· 從服務器導出一個簡單的REST API來使用模型。

https://github.com/evilsocket/ergo

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章