2019年頂級機器學習文章的總結概述

 

在本文中,我們將仔細研究2019年排名的一些頂級機器學習文章。

 

Facebook,卡內基·梅隆(Carnegie Mellon)建立了首個在6人撲克中擊敗職業玩家的AI

 

Pluribus是第一款能夠在六人無限注德州撲克中擊敗人類專家的AI機器人,這是世界上使用最廣泛的撲克格式。這是AI機器人第一次在超過兩個或兩個團隊的複雜遊戲中擊敗頂級人類玩家。

Pluribus經過了職業撲克玩家測試。其中包括世界撲克系列大賽的兩名優勝者。Pluribus使用自我遊戲來教自己如何取勝。發生這種情況時沒有任何示例或指導。Pluribus中使用的自播放版本是迭代蒙特卡洛CFR(MCCFR)算法的改進版本。

在算法的每次迭代中,MCCFR都會指定一個參與者作爲“遍歷者”,其當前策略會在迭代中進行更新。在迭代開始時,MCCFR會根據所有玩家的當前策略(最初是完全隨機的)來模擬一手撲克。一旦完成模擬手操作,該算法便會檢查遍歷器做出的每個決策,並通過選擇其他可用操作來調查它會做的好壞。接下來,AI會評估在遵循其他可用操作之後可能做出的每個假設決策的優劣,依此類推。

 

 

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker

 

重量不可知神經網絡(Weight Agnostic Neural Networks)

 

這篇文章提出了一種神經網絡體系結構的搜索方法,該方法可以執行任務而無需任何明確的權重訓練。通過使用從均勻隨機分佈中採樣的單個共享權重參數填充連接來評估這些網絡。該方法能夠找到最小的神經網絡架構,該架構可以執行強化學習任務而無需權重共享。

https://weightagnostic.github.io/

 

基於神經點的圖形(Neural Point-Based Graphics)

 

作者提出了一種基於點的方法來對複雜場景進行建模。它使用原始點雲作爲場景的幾何表示。然後,它通過對局部幾何形狀和外觀進行編碼的可學習的神經描述符來擴展每個點。

 

通過與描述符並行學習深度渲染網絡,從而可以通過將來自新視點的點雲的柵格化傳遞到該網絡來獲取場景的新視圖。輸入柵格化將學習到的描述符用作點僞色。

https://arxiv.org/pdf/1906.08240.pdf

 

進化選擇如何訓練能力更強的自動駕駛汽車(How evolutionary selection can train more capable self-driving cars)

 

在達爾文對進化的洞察力的啓發下,Waymo和DeepMind的工程師着手進行一項研究項目,旨在使神經網絡的訓練更加有效。他們設計了一種基於進化競爭自動確定好的超參數計劃的方法-基於人口的培訓(PBT)。

 

對網絡進行評估,並以進化的方式相互競爭以求生存。 一個性能較差的網絡將被性能更佳的網絡(後代)取代。 後代是種羣中表現更好的成員的副本。

 

https://deepmind.com/blog/article/how-evolutionary-selection-can-train-more-capable-self-driving-cars

 

Google Research Football簡介:一種新穎的強化學習環境

 

Google Research Football是增強學習環境,旨在掌握足球。

 

它提供了基於物理的3D足球模擬,代理商可以控制團隊中的一名或所有足球運動員。 他們學習如何在彼此之間傳遞,並且能夠克服對手的防守才能得分。

足球環境提供:

  •  高度優化的遊戲引擎

  •  一組要求很高的研究問題,稱爲足球基準

  •  足球學院,一套越來越困難的RL場景

 

Beta版本可以在GitHub上找到。

 

https://github.com/google-research/football

 

https://arxiv.org/pdf/1907.11180.pdf

 

使用Python構建DAB和T姿勢控制的燈光(Building Dab and T-Pose Controlled Lights with Python)

 

本文將引導您構建一個可以通過網絡攝像頭識別舞步的神經網絡。 作者使用OpenPose檢測身體位置。

https://www.makeartwithpython.com/blog/dab-and-tpose-controlled-lights/

https://github.com/burningion/dab-and-tpose-controlled-lights

 

 

在Uber藉助機器學習在模擬環境中獲取數據(Gaining Insights in a Simulated Marketplace with Machine Learning at Uber)

Uber Marketplace Simulation團隊構建了一個仿真平臺,該平臺託管了一個具有騎手和駕駛員夥伴的模擬環境。 環境模仿現實世界中的場景。 它使用基於代理的離散事件模擬器。 該平臺使Uber Marketplace工程師和數據科學家能夠在無風險的環境中快速原型化和測試新功能。

https://eng.uber.com/simulated-marketplace/

 

安全性之外的穩健性:計算機視覺應用(Robustness beyond Security: Computer Vision Applications)

 

在本文中,作者討論了以下計算機視覺論文:

 

https://arxiv.org/pdf/1906.09453.pdf

他們的假設是基本分類框架可用於解決具有挑戰性的圖像合成任務。 作者開發的工具包對所有任務使用了一個現成的分類器。 分類器經過訓練,具有對抗性強。

https://github.com/MadryLab/robustness_applications

 

使用Keras和深度學習進行視頻分類(Video classification with Keras and Deep Learning)

 

本文將教您如何使用Keras和Python進行視頻分類。 本文介紹瞭如何使用CNN進行視頻分類。

 

https://www.pyimagesearch.com/2019/07/15/video-classification-with-keras-and-deep-learning

 

奪旗:複雜的合作環境的出現(Capture the Flag: the emergence of complex cooperative agents)

 

 

 

本文介紹了遊戲中的強化學習。 作者的最新論文展示瞭如何在Quake III Arena Capture the Flag中實現人類水平的表現。

作者使用錦標賽風格的評估來說明代理可以在三維多人第一人稱視頻遊戲中達到人類水平的性能。僅分數的像素和遊戲點用作輸入。他們使用了兩層優化過程。在此過程中,在隨機生成的環境中從數千次並行匹配中同時訓練一羣獨立的RL代理。每個代理都學習自己的內部獎勵信號和對世界的豐富表示。

https://science.sciencemag.org/content/364/6443/859.full?ijkey=rZC5DWj2KbwNk&keytype=ref&siteid=sci

https://deepmind.com/blog/article/capture-the-flag-science

 

無需獎勵工程的端到端深度強化學習(End-to-End Deep Reinforcement Learning without Reward Engineering)

 

 

 

本文討論了一種端到端方法,該方法允許機器人從圖像中學習,這些圖像說明了特定任務的成功執行。 不應用手動獎勵工程。

https://bair.berkeley.edu/blog/2019/05/28/end-to-end

https://github.com/avisingh599/reward-learning-rl

 

移動相機,移動人員:深度學習的深度學習方法(Moving Camera, Moving People: A Deep Learning Approach to Depth Prediction)

本文討論了移動人員的深度預測。 這是通過應用基於深度學習的方法完成的,該方法從人們自由移動的視頻中生成深度圖。 該模型學習人體姿勢,因此不依賴於直接3D三角剖分。

https://ai.googleblog.com/2019/05/moving-camera-moving-people-deep.html

 

CNN,第1部分:卷積神經網絡簡介(CNN's, Part 1: An Introduction to Convolutional Neural Networks)

 

 

這是卷積神經網絡(CNN)的簡介,包括如何使用NumPy從頭開始在Python中構建一個的知識。

https://victorzhou.com/blog/intro-to-cnns-part-1

https://github.com/vzhou842/cnn-from-scratch/tree/forward-only

 

 

推進自我監督,簡歷,自然語言處理,以確保平臺安全(Advancing self-supervision, CV, NLP to keep our platforms safe)

 

本文介紹了Facebook如何提高其內容理解系統的準確性和效率,以及如何通過減少監督學習來實現更多目標。

 

本文突出顯示的主要內容是:

 

  • 內容理解的自我監督的未來

  • 使用主題標籤實現視頻記錄設置的準確性

  • 促進最新的照片和視頻理解

  • 使用多語言句子嵌入來處理有害內容

 

使用Nvidia Jetson Nano和Python以150美元的價格構建基於硬件的面部識別系統

藉助Nvidia Jetson Nano,您可以構建獨立的硬件系統,從而以很小的預算運行GPU加速的深度學習模型。 它就像Raspberry Pi,但速度更快。

https://medium.com/@ageitgey/build-a-hardware-based-face-recognition-system-for-150-with-the-nvidia-jetson-nano-and-python-a25cb8c891fd

 

進入邏輯電路的模塊化神經進化(Descending into modular neuroevolution for logic circuits)

本文介紹了使用具有梯度下降的神經進化來構建和訓練邏輯電路。

https://www.declanoller.com/2019/05/24/descending-into-modular-neuroevolution-for-logic-circuits

 

https://github.com/declanoller/hyper_NE_GD

 

總結

更多論文地址或源碼下載地址:關注“圖像算法”wx公衆號,回顧2019年,我們看到很多作者,研究團隊做出了令人難以置信的貢獻,並且發表了高質量的論文和提供源碼做出了非常多的貢獻,感謝他們無私的奉獻精神。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章