卷首語：人工智能的成功取決於數據

作者：MongoDB中文社區主席 唐建法

最近，清華大學教授、中國科學院張鈸院士在接受經濟觀察報的時候提到：“基於深度學習的人工智能在技術上已經觸及天花板， AI奇蹟短期難以再現。”這無疑爲許許多多仍然以AI爲主要業務亮點的創業公司敲響了警鐘。

當下，人工智能已經成爲一個流行語。從語音識別到自動客服，從人臉圖像識別到自動駕駛，不可否認，AI已經實實在在出現在我們的生活中了。AI創業公司更是熱情甚高，動輒即稱AI驅動，就連世界級大牌公司Oracle也不例外，前段時間的Oracle Autonomous Database，按照Larry的說法，通過AI和ML技術，做到了“Totally Automated，Self-Driving”（全部自動，自運行）, 不再需要人類來管理或者調優。我覺得要麼是Larry在騙我，要麼最近作爲數據庫顧問加入Oracle的朋友在騙我——如果Larry 說實話的話，爲什麼 Oracle 還要繼續大量招聘爲客戶做數據庫維護性能調優的顧問？

像大數據一樣，對人工智能的炒作也導致了一種趨勢，即每個供應商都聲稱在技術、解決方案或產品中利用了它，都說要改變、替代人類，從而造成了一個良莠不齊、極度混淆的技術怪圈。

事實上，就像大數據技術不能解決所有的企業數據問題一樣，AI也不能用來解決所有問題。如果想了解AI最應該用在何處，並且最容易成功，我們必須先了解AI的真正含義。

AI或機器學習是指一組廣泛的算法，如果訓練得當，它們可以解決一組特定的問題。把機器學習算法集成到產品中其實是微不足道的——有大量公開的算法可以用，但有效地使用數據來訓練算法並執行任務卻並非那麼簡單。事實上，一個AI項目從開始施行到初有成效，多達80%的精力都是用在數據準備上的。

當有大量豐富的數據可用時，AI效果是最佳的。數據量越大，覆蓋維度越多，算法學習和調整預測分析的速度就越快。根據行業預測，在2018年，人工智能的最大限制——高質量數據，將變得更加明顯。成功的機器學習取決於大型和廣泛的數據集，以及對這些數據的有效管理。

誰能夠獲得最優質最全面的原始數據，誰掌握最成熟的數據處理與加工技術，纔是未來真正AI項目的核心能力。所以，對很多不明真相的技術人來說，與其盲目的追捧AI，不如實實在在地掌握精通數據處理的技術，這纔是一條不會受到泡沫破裂而影響的務實之路。

架構師（2019年6月）

卷首語：人工智能的成功取決於數據

目錄

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

2021雲智技術論壇-知識智能化專場

智慧家庭場景的推薦系統的發展歷程和方向 | InfoQ《公開課》

中國卓越技術團隊訪談錄（2021年第六季）

共話“勒索軟件”應對之道——能源篇

共話“勒索軟件”應對之道——電子政務篇

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結