人工智能AlphaGo是什麼原理

  作爲一種人工智能的 AlphaGo,和 IBM 在上個世紀打敗國際象棋大師卡斯帕羅夫的深藍超級計算機,以及當代的蘋果 Siri、Google Now 有着顯著的區別。

  要了解 AlphaGo,首先我們需要了解 AlphaGo 背後到底是一個什麼東西。

  它背後是一套神經網絡系統,由 Google 2014 年收購的英國人工智能公司 DeepMind 開發。這個系統和深藍不同,不是一臺超級計算機,而是一個由許多個數據中心作爲節點相連,每個節點內有着多臺超級計算機的神經網絡系統。就像人腦,是由 50-100 億個神經元所組成的,這也是爲什麼這種機器學習架構被稱爲神經網絡。

你可以將 AlphaGo 理解爲《超驗駭客》(Transcendence) 里約翰尼·德普飾演的人工智能,而它所控制的超級計算機,就像影片裏被人工智能心控的人類一樣,共同爲一種蜂羣思維 (Hive Mind) 服務。《超驗駭客》中,被人工智能控制的工人馬丁。馬丁沒有所想,但他的所見將會被人工智能直接獲取

wKioL1bf_rjhH4GgAAFk1jjJ-Qw794.jpg

 AlphaGo 是在這個神經網絡系統上,專爲下圍棋 (Go) 而開發出的一個實例。然而,雖然名字已經介紹了它的功能,AlphaGo 背後的神經網絡系統卻適合用於任何智力競技類項目。

  這個系統的基礎名叫卷積神經網絡 (Convolutional Neural Network, CNN) ,這是一種過去在大型圖像處理上有着優秀表現的神經網絡,經常被用於人工智能圖像識別,比如 Google 的圖片搜索、百度的識圖功能都對卷積神經網絡有所運用。這也解釋了爲什麼 AlphaGo 是基於卷積神經網絡的,畢竟圍棋裏勝利的原理是:

 AlphaGo 暗地裏的零碎還鑑戒了一種名爲深度強化進修 (Deep Q-Learning, DQN) 的技術。強化進修的靈感來歷於生理學中的行動主義實際,即有機體如安正在情況賜與的處分或者懲辦的安慰下,漸漸構成對於安慰的預期,發生能得到最大好處的風不雅性行動。不但如斯,AlphaGo 鑑戒了蒙特卡洛樹搜尋算法 (Monte Carlo Tree Search) ,正在斷定以後場合排場的服從函數 (value function) 和決議下一步的計謀函數 (policy function) 上有着很是好的表示,遠超越上一個可能和人類棋手半斤八兩的圍棋順序。

  AlphaGo 所採納的 DQN 是一種具備遍及順應性的強化進修模子,說白了便是不必改動代碼,你讓它下圍棋它能下圍棋,你讓它正在紅白機上玩超等瑪麗和太空侵犯者,它也不會手生。作爲一個基於卷積神經收集、採納了強化進修模子的野生智能,AlphaGo 的進修本領很強,每一每一新上手一個名目,玩上多少局就可以得到比天下上最鋒利的選手還強的氣力。

  2014 年,曾經被 谷歌 收買的 DeepMind,用五款雅達利 (Atari) 遊戲 Pong、打磚塊、太空侵犯者、海底救人、Beam Rider 分開測試了本人開闢的野生智能的機能,成果看見:正在兩三般遊戲後,神經收集的操控本領曾經遠超天下上任何一名已經知的遊戲妙手。

  DeepMind 用一樣的一套野生智能,不調解代碼就去測試各類百般的智力競技名目,取患了優秀的戰績,足以證實本日坐正在李世石背後的 AlphaGo ,領有多強的進修本領。

  在此之前,DeepMind 進行過的無數虛擬棋局訓練,以及去年擊敗歐洲圍棋冠軍樊麾二段的經驗讓 AlphaGo 已經訓練出了頂尖的弈技,極有可能高於世界上任何已知的圍棋高手。

wKioL1bf_qKgeEqMAAAzOEZgvdk453.gif

  儘管棋盤上風雲變化,早在本次開戰前,AlphaGo 跟李世石就已不在同一起跑線上了。至於李世石曾經做出 AlphaGo 和自己棋份在二子和讓先之間的評論,恐怕第一局足夠讓他反悔了。

 AlphaGo 只是 DeepMind 證明自己的一個工具。你也可以將這次和李世石的對局理解爲 Google 的公關策略。

  2014 年,這家公司曾經在其官網上寫道: DeepMind 致力於用研究深度學習的方式去真正瞭解智慧 (solve intelligence) 。但對於 DeepMind 和 Google 來說,打造 AlphaGo 以及其他人工智能神經網絡不是終點。

 將機器學習和神經科學進行結合,打造出一種“一般用途的學習算法”。通過這種算法,DeepMind 和 Google 希望能夠將智能“定型化”,理解智能是什麼,進而更好的幫助人類理解大腦。

  在 Google 收購 DeepMind 前,收購條款中的一項就是 Google 必須成立人工智能道德委員會。因此,在目前階段人們不必擔心這樣的人工智能最終殺死或統治人類。但至少,人工智能在圍棋這樣的智力類競技項目上擊敗人類,是已經註定的事情。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章