架構師(2019年6月)

卷首語:人工智能的成功取決於數據

作者:MongoDB中文社區主席 唐建法

最近,清華大學教授、中國科學院張鈸院士在接受經濟觀察報的時候提到:“基於深度學習的人工智能在技術上已經觸及天花板, AI奇蹟短期難以再現。”這無疑爲許許多多仍然以AI爲主要業務亮點的創業公司敲響了警鐘。

當下,人工智能已經成爲一個流行語。從語音識別到自動客服,從人臉圖像識別到自動駕駛,不可否認,AI已經實實在在出現在我們的生活中了。AI創業公司更是熱情甚高, 動輒即稱AI驅動,就連世界級大牌公司Oracle也不例外,前段時間的Oracle Autonomous Database,按照Larry的說法,通過AI和ML技術,做到了“Totally Automated,Self-Driving”(全部自動,自運行), 不再需要人類來管理或者調優。我覺得要麼是Larry在騙我,要麼最近作爲數據庫顧問加入Oracle的朋友在騙我——如果Larry 說實話的話,爲什麼 Oracle 還要繼續大量招聘爲客戶做數據庫維護性能調優的顧問?

像大數據一樣,對人工智能的炒作也導致了一種趨勢,即每個供應商都聲稱在技術、解決方案或產品中利用了它,都說要改變、替代人類, 從而造成了一個良莠不齊、極度混淆的技術怪圈。

事實上,就像大數據技術不能解決所有的企業數據問題一樣,AI也不能用來解決所有問題。如果想了解AI最應該用在何處,並且最容易成功,我們必須先了解AI的真正含義。

AI或機器學習是指一組廣泛的算法,如果訓練得當,它們可以解決一組特定的問題。把機器學習算法集成到產品中其實是微不足道的——有大量公開的算法可以用,但有效地使用數據來訓練算法並執行任務卻並非那麼簡單。事實上,一個AI項目從開始施行到初有成效,多達80%的精力都是用在數據準備上的。

當有大量豐富的數據可用時,AI效果是最佳的。數據量越大,覆蓋維度越多,算法學習和調整預測分析的速度就越快。根據行業預測,在2018年,人工智能的最大限制——高質量數據,將變得更加明顯。成功的機器學習取決於大型和廣泛的數據集,以及對這些數據的有效管理。

誰能夠獲得最優質最全面的原始數據,誰掌握最成熟的數據處理與加工技術,纔是未來真正AI項目的核心能力。 所以,對很多不明真相的技術人來說,與其盲目的追捧AI,不如實實在在地掌握精通數據處理的技術,這纔是一條不會受到泡沫破裂而影響的務實之路。

目錄

熱點 | Hot

谷歌中止與華爲業務往來,華爲自研手機 OS 也要一夜“轉正”?

產業互聯網起風了:這一次,騰訊又站上了風口

理論派 | Theory

阿里將 Transformer 用於淘寶電商推薦,效果優於 DIN 和谷歌 WDL

推薦文章 | Article

一張主流編程語言的變遷圖,講清程序員遷移模式

爲什麼高級程序員寫的代碼都是傻瓜式的?

觀點 | Opinion

W3C Web 技術總負責人:拓展 Web 核心能力,W3C 關注哪些技術?

人人都是 API 設計師:我對 RESTful API、GraphQL、RPC API 的思考

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章