大模型將進一步推動AI數據發展,行業數據類型更加豐富

爲支撐加快推進新型工業化,發展新質生產力,探索數據要素與智能算力網絡協同發展路徑,促進數字技術與實體經濟深度融合,中國信息通信研究院作爲新型基礎設施建設者,科技創新的領軍者,在2024星火生態大會期間,舉辦了"數據要素及智能算力網絡創新專題研討會"。研討會聚焦數據要素流通、算力網絡優化及人工智能創新應用等熱點主題,探索數據、算力、人工智能融合發展路徑,進一步推進數據流通網絡和智能算力基礎設施建設,促進人工智能與行業深度融合。

作爲人工智能的基石,數據的重要性不言而喻。隨着大模型時代的到來,正加速推動人工智能開發從以模型爲中心朝着以數據爲中心的方向轉變。而不斷增長的場景化人工智能應用向數據提出了更高的需求,呈現出新的發展趨勢。

雲測數據總經理賈宇航在數據要素及智能算力網絡創新專題研討會上,進行了"人工智能數據行業趨勢展望與技術實踐"的分享,其對於人工智能數據行業趨勢有三大展望,一是大模型進一步推動行業發展,應用數據行業化;二是技術迭代將對數據標註重新定義;三是數據工具也促進AI進一步工程化迭代。

OpenAI發佈ChatGPT爲大模型發展按下了加速鍵,各個行業、領域相繼發佈相關大模型解決方案。大模型技術成果不斷湧現的當下,也面臨訓練成本高、應用場景單一、缺乏高質量細分領域數據等難題。雲測數據針對大模型場景化落地的特點,率先推出了面向垂直行業的大模型數據解決方案,以全新升級的數據服務體系爲大模型提供可靠支撐,助推我國大模型能力實現全面升級。

雲測數據垂直行業大模型AI數據解決方案可以幫助企業快速獲取多樣化訓練數據、高效完成數據標註、建立統一規範的數據管理體系、輸出標準化可直接用於模型訓練的數據集、提供端到端全流程的數據服務等,從而滿足大模型持續迭代的需求,加速模型在實際場景中的落地應用。

對於如何充分發揮AI數據對人工智能產業落地的價值,賈宇航認爲,一是加強場景化數據的能力,換言之就是爲人工智能細分場景的落地,提供更加垂直且豐富的數據,滿足其長尾場景的需求;二是提升數據標註的準確性,從工具、規則、流程的開發制定,到標註人員的素質培養,從細節提升數據標註準確性;三是充分發揮"底層技術+服務能力"的力量,具備更深刻的行業領域知識、更懂場景、更懂技術、更具行業前瞻性。

在賈宇航看來,未來,數據標註也會和人工智能技術一樣,逐漸深入到各個行業及場景當中,呈現細分化、專業化。在這一過程中,對技術迭代將提出更高要求,不僅數據處理要做到足夠專業,對行業特徵和企業需求也要有深入瞭解,數據工具也將促進AI進一步工程化迭代。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章