AI週報：Tumblr 用戶控訴TensorFlow不如PyTorch；2019全球AI報告：每天2億美元投入AI領域，1/10砸向自動駕駛；紐約大學開發出BLiMP，可測試BERT和GPT-2等語言模型

資訊

Tumblr 用戶控訴TensorFlow“太糟糕”，認爲PyTorch更好用

近日，一位Tumblr用戶控訴谷歌的TensorFlow有點讓人摸不着頭腦，用起來也有不夠順手。他在發文中提到，TensorFlow的代碼有點冗雜，但是谷歌依然不斷地爲軟件發佈新特性，最終導致軟件更加難於理解和使用。

開發者列出了TensorFlow一系列使用缺陷，“知道它在某些方面讓我想起了什麼嗎？在出現大量向後不兼容新特性後，好不容易剛剛掌握了特定平臺的相關知識後，這種知識又將在兩年內被淘汰，這的確會讓人沮喪，”Tumblr這樣用戶寫道。

隨着人工智能逐漸步入工業化階段，越來越多人將使用軟件來開發人工智能，而能吸引最多開發者的軟件將可能成爲類似Linux這樣的新計算實現的基礎。所以，人們對TensorFlow的抱怨與對PyTorch的欣賞就形成了鮮明的對比。Facebook開發的PyTorch人工智能軟件框架顯然要比TensorFlow更容易使用，也更加靈活。

紐約大學研究員開發出BLiMP，用於測試BERT和GPT-2等語言模型

過去幾年，像BERT和GPT-2這樣的大型語言模型顛覆了自然語言處理的研究，在短時間內取得了巨大突破。目前，紐約大學研究員開發了一款能幫助人們更容易對比不同模型性能的benchmark，這款benchmark可以比較出不同模型的優缺點，同時還能將語言模型與人類表現進行對比。

該benchmark被稱爲BLiMP，是“語言最小對立組benchmark”的縮寫。BLiMP測試了語言模型如何根據不同的標準對不同的句子進行分類，測試涉及了12種語言現象，包括省略、主謂一致、不規則形式等。BLiMP也提供了人類基準線，幫助我們根據絕對得分和相對錶現來比較語言模型。BLiMP完整數據集由67個分類（1000個句子對）組成，每個分類屬於12種語言現象中的一種。

“我們評估的所有模型都遠低於人類的表現”，研究人員這樣寫道。“GPT-2表現最好，在某些語法現象上和人類表現平分秋色（甚至幾乎超越人類），但是整體表現比人類低8%。”需要注意的是，作者僅測試了中型版本的GPT2（對比7.75億參數的大版本和15億參數的XL超大版本來說，3.45億的版本就是中型版本），所以姑且可以認爲其他版本的性能會更好一些。通過對比發現，Transformer-XL、LSTM和5-gram表現更差。

他們寫道，BLiMP可以“作爲作爲benchmark對新語言模型的總體表現進行評估”。此外，由於BLiMP測試可以適用於不同的語言現象中，因此可利用它詳細對比不同模型之間的差異和優劣。

2019 年 ACM Fellow 公佈：阿里平頭哥首席科學家謝源等 7 位華人當選

紐約時間 12 月 11 日，美國計算機學會（ACM）宣佈 2019 年新當選 ACM Fellow 名單，共有 58 位科學家當選，其中包括有阿里平頭哥首席科學家、達摩院高級研究員謝源在內的 7 位華人學者。這 7 位華人學者分別是陳熙霖、李向陽、呂鬆武、陶大程、謝源、周禮棟、Dawn Song，來自人臉識別、物聯網、蜂窩網絡、分佈式計算、安全和隱私等不同研究領域。ACM Fellow 用於表彰在計算機和信息技術領域從業五年以上，並做出”突出貢獻“（Exceptional Contributions）的科學家，只有 1% 的 ACM 會員有機會當選。

ACM 創立於 1947 年，目前在全世界 130 多個國家和地區擁有超過 10 萬名會員，是世界上最大的教育和科學計算機協會，其所評選的圖靈獎被譽爲”計算機界的諾貝爾獎“。ACM Fellow 計劃於 1993 年啓動，旨在表彰計算領域領先成員的傑出貢獻，截止目前已有 1000 多位 ACM Fellow 誕生。本次選出的 58 名 ACM Fellow 分別來自澳大利亞、加拿大、中國、埃及、法國、德國、以色列、意大利、瑞士和美國的大學、公司和研究中心。

谷歌助理現能在智能手機上翻譯 44 種語言

在今年一月的拉斯維加斯消費電子展期間，谷歌首次推出了“口譯員模式”，這是一種實時翻譯功能，適用於 Google Home 揚聲器和第三方智能顯示器（例如索尼，LG 和聯想）。當時，這家科技巨頭表示，解釋器模式最終會出現在移動設備上。

該功能於12月13日正式上線。自13日一早開始，Android 和 iOS 智能手機上的 Google Assistant 都支持口譯員模式，用戶可以通過它詢問路線、點菜或用外語聊天等。其可以識別的語言數量從之前的 27 種增加到了 44 種，包括希臘語、土耳其語和漢語等。並且現在在解釋器模式下，用戶可以選擇使用鍵盤輸入文字或手動選擇他們要說的語言。

微軟首款 Office 應用程序登陸 Linux

今年 9 月時，微軟曾確認正在爲 Linux 構建 Teams 客戶端。時隔兩個多月，微軟在官方博客中宣佈 Microsoft Teams 已在 Linux 上公開預覽，並可下載使用，該本地軟件包有 .deb 和 .rpm 兩種格式以供選擇。

Microsoft Teams 客戶端是微軟引入 Linux 的首款 Office 365 應用程序，它是一款集成的辦公軟件，提供即時聊天、視頻會議、文件共享等功能，使團隊能夠輕鬆協作。Teams 是微軟有史以來增長最快的業務應用，根據微軟上個月公佈的數據，該應用每天有 2000 萬活躍用戶。

微軟承諾，此次的 Linux 版本也將同樣支持 Teams 的所有核心功能。不過它現在仍處於公開預覽狀態，也就意味着部分功能可能暫時無法使用或無法正常工作。微軟工作人員告訴外媒 VentureBeat：“會議中有一些與 Office 應用和屏幕共享/控制相關的功能，在 Linux 中尚不可用”。同時微軟也表示將根據社區的反饋進一步做出改進，期待用戶下載並提交使用反饋。

《斯坦福2019全球AI報告》：每天2億美元投入AI領域，1/10砸向自動駕駛

由斯坦福大學發起的人工智能指數（AI Index）是一個追蹤 AI 動態和進展的非營利性項目，旨在全面研究 AI 行業狀況，目標是促進基於數據的 AI 的廣泛交流和有效對話。12月12日，AI Index 發佈了 2019 年度報告。《報告》顯示，2019年，全球私有AI投資超過700億美元，相當於每天2億多美元砸向AI領域。此外，自動駕駛汽車在過去一年中獲得了全球投資的最大份額（77億美元），其次是AI醫療（47億美元）、面部識別（47億美元）、視頻內容（36億美元）和欺詐檢測和金融（31億美元）。

量子計算機實用重要里程碑！英特爾發佈首款低溫控制芯片Horse Ridge

英特爾研究院發佈了代號爲“Horse Ridge”的首款低溫控制芯片，以加快全棧量子計算系統的開發步伐。作爲量子實用性道路上的一個重要里程碑， Horse Ridge實現了對多個量子位的控制，併爲向更大的系統擴展指明瞭方向。

基於英特爾22納米FinFET技術，英特爾與QuTech（由荷蘭代爾夫特理工大學與荷蘭國家應用科學院聯合創立）共同開發了Horse Ridge。控制芯片的製造在英特爾內部完成，將極大地提高英特爾在設計、測試和優化商業上可行的量子計算機的能力。

英特爾量子硬件總監Jim Clarke 表示：“雖然人們非常重視量子位本身，但同時控制多個量子位仍是業界的一大挑戰。英特爾認識到，量子控制是大規模商用量子系統開發過程中的核心環節，這也是英特爾投資量子糾錯和控制技術的原因。通過Horse Ridge，英特爾開發了一個可擴展的控制系統，能夠大大加快測試速度並實現量子計算的潛力。”

谷歌推出改進版文本分類和模型訓練的 AutoML 自然語言

今年早些時候，谷歌完成了其 AutoML 自然語言的收尾工作，這是其 Cloud AutoML 機器學習平臺向自然語言處理領域的擴展。經過長達一個月的測試後，AutoML自12月13日起開始向全球客戶開放，支持分類、情感分析和實體提取等任務，以及一系列文件格式—包括本機和掃描的 PDF。

AutoML 自然語言可以利用機器學習來揭示電子郵件、聊天記錄、社交媒體帖子等中文本的結構和含義。它可以從上傳和粘貼的文本或谷歌雲盤文檔中提取有關人員、地點和事件的信息，並且允許用戶訓練自己的自定義 AI 模型來分類，檢測和分析諸如情感，實體，內容和句法等。此外，它還提供自定義實體提取功能。

聲音

軟銀中國華平：圍繞AI智能化、醫療健康、新材料進行投資

在第十九屆中國股權投資年度論壇上，軟銀中國資本管理合夥人華平表示，軟銀中國仍將主要圍繞科技型企業投資，他提到三大領域：AI智能化、醫療健康、新材料。關於AI智能化，華平認爲，雖然大家在這方面已經講了很長時間，但從概念到真正改變行業，實際上還是剛剛開始。同時，ToB也一直是軟銀中國在投資上大的方向。未來，“還會持續在這裏面再加碼”。

軟銀中國資本管理合夥人華平

從宏觀角度來看，華平認爲，圍繞科技創新的投資一定會升溫，在行業所佔的比重會越來越大。同時他指出，有兩方面因素會推動這種變化到來。首先，是中美之間貿易的討論。這意味着國內一定會培養很多的高科技企業，形成擁有自己豐富核心技術的產業鏈；再者，科創板到目前爲止健康運營，已經上市幾十家公司，可以縮短投資科技型企業的退出週期，也會讓大家更願意去投資科技型企業。

AI開源工具

Multi Model Server

Multi Model Server（MMS）是一個靈活且易於使用、用任何ML/DL框架都可進行深度學習模型訓練的工具。使用MMS Server CLI或預配置Docker圖像來設置HTTP端點來處理模型推理請求。

https://github.com/awslabs/multi-model-server

ergo
ergo是從拉丁語“我思故我在 Cogito ergo sum”中而來，這是一款能讓Keras機器學習更加簡單的命令行工具。它可以：
· 用最少數量的代碼在數秒內構建新項目；
· 編碼樣本、導入和優化CSV數據集並且用這些來訓練模型；
· 在訓練中可視化模型結構、損失和精準函數；
· 藉助差分推理決定每個輸入特徵如何影響精準度；
· 從服務器導出一個簡單的REST API來使用模型。

https://github.com/evilsocket/ergo

AI週報：Tumblr 用戶控訴TensorFlow不如PyTorch；2019全球AI報告：每天2億美元投入AI領域，1/10砸向自動駕駛；紐約大學開發出BLiMP，可測試BERT和GPT-2等語言模型

資訊

Tumblr 用戶控訴TensorFlow“太糟糕”，認爲PyTorch更好用

紐約大學研究員開發出BLiMP，用於測試BERT和GPT-2等語言模型

2019 年 ACM Fellow 公佈：阿里平頭哥首席科學家謝源等 7 位華人當選

谷歌助理現能在智能手機上翻譯 44 種語言

微軟首款 Office 應用程序登陸 Linux

《斯坦福2019全球AI報告》：每天2億美元投入AI領域，1/10砸向自動駕駛

量子計算機實用重要里程碑！英特爾發佈首款低溫控制芯片Horse Ridge

谷歌推出改進版文本分類和模型訓練的 AutoML 自然語言

聲音

軟銀中國華平：圍繞AI智能化、醫療健康、新材料進行投資

AI開源工具

Multi Model Server

公司新來一個幹練小夥，把 MyBatis 替換成 MyBatis-Plus，上線後哭暈在廁所。。。

支持非IE瀏覽器真的那麼難嗎？

爲啥就那麼痛恨IE？

2024 開源數據工程生態系統全景圖

Brian Sun：回覆“爲啥就那麼痛恨IE？”

【筆記】動手學深度學習-前言

體驗下，大廠在使用功能的API網關！

見鬼了！我家的 WiFi 只有下雨天才能正常使用...

短視頻文案提取原來如此簡單

oa系統集成及案例樣式

被美列入投資禁令清單，商湯科技推遲香港IPO

洞察數據庫變革趨勢，亞馬遜雲科技正在憑藉這項技術改變着遊戲規則

DeepMind新研究登上Nature封面，這一數學難題被AI攻破了

請不起日薪2萬+的網絡安全人才，就做不好數字化轉型嗎？

2022 IEEE Fellow新晉名單出爐，王海峯、李飛飛等AI大佬入選，華人學者近三成

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結