數據智能,×××!袋鼠雲數棧推出 數據科學平臺 DTinsight.Science

一句話瞭解DTinsight.Science

DTinsight.Science是「可視化建模與交互式代碼編寫於一體的機器學習作業探索平臺」,實現數據接入、可視化實驗建模、Notebook編程、模型訓練、模型部署、任務運維等開發場景,幫助企業構建算法服務能力,提供高效、安全、穩定的算法運行環境。

使用數棧-數據科學平臺DTinsight.Science進行一站式數據探索

使用數棧-數據科學平臺DTinsight.Science進行一站式數據探索

劃重點!

數棧-數據科學平臺 DTinsight.Science是什麼:
機器學習作業探索平臺

數棧-數據科學平臺 DTinsight.Science的產品目標是:
提供專業、可靠、高效的算法建模平臺,一站式完成算法建模、模型訓練、模型部署等機器學習作業,讓數據智能×××。

數棧-數據科學平臺 DTinsight.Science的客戶價值是:
幫助企業構建算法服務能力,讓數據智能快速落地,構建數據智能化與業務智能化雙向驅動引擎。

數棧-數據科學平臺 DTinsight.Science給誰用:
企業的數據科學家和數據分析師們

再深入瞭解DTinsight.Science

2.1 研發初衷

隨着大數據在企業中橫向與縱向的深度應用,已經有離線計算、實時計算等大數據產品解決客戶常用的計算與運維場景。目前,數據的智能化應用也是更多企業應用、探索的方向,讓數據智能驅動業務智能。在這個過程中,怎麼讓更多的企業快速擁有數據智能化的能力,是數據科學平臺思考的方向。

所以今天,數棧推出數據科學平臺來構建數據加工後的算法建模能力,爲數據科學家數據分析師提供完善易用的開發平臺,希望爲企業提供更加科學、準確的判斷,實現數據的高價值應用。

2.2 產品優勢

兼容主流機器學習與深度學習框架

TensorFlow \ MXNet \ Python \ Spark

數棧-數據科學平臺DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark計算框架,不同的算法任務可選擇合適的計算框架,支持多維化開發場景。後續也將支持Pytorch、XGboost等計算框架。
數據智能,×××!袋鼠雲數棧推出 數據科學平臺 DTinsight.Science

豐富的算法組件庫

你需要的組件,我都會有

數棧-數據科學平臺DTinsight.Science封裝了多類算法組件,包含數據源/目標、SQL腳本工具、數據預處理、特徵工程、統計分析、機器學習、深度學習、預測、評估、文本分析、網絡分析等算法組件,充分覆蓋算法建模場景。

數據智能,×××!袋鼠雲數棧推出 數據科學平臺 DTinsight.Science

DTinsight.Science具有豐富的算法組件

可視化實驗建模

可視化、拖拉拽方式進行算法建模

在大數據深度應用的現在,越來越多的人員對數據與業務的智能結合,算法模型搭建充滿興趣。數棧-數據科學平臺DTinsight.Science支持可視化實驗建模,可將算法組件拖拉拽至畫布區域,組成可視化的實驗流,可界面化配置組件參數,並可視化查看數據運行結果以及模型結果,簡單易上手。

數據智能,×××!袋鼠雲數棧推出 數據科學平臺 DTinsight.Science
DTinsight.Science支持可視化實驗建模

交互式Notebook數據探索

使用Python自由進行數據探索

除可視化的實驗搭建外,數據科學平臺同時具備交互式Notebook開發環境,可進行python代碼的編寫,執行某段語句查看相應結果與運行日誌,爲數據分析師提供自由的數據探索環境。

數據智能,×××!袋鼠雲數棧推出 數據科學平臺 DTinsight.Science
交互式Notebook自由進行數據探索

模型離線訓練

週期調度,訓練模型參數

算法模型開發完成後,可提交任務進行離線調度,調度引擎根據調度週期進行模型訓練,產生新的模型參數與數據。模型訓練完成後,可查看評估結果,選取合適的模型參數進行保存應用,或在線部署。

模型在線部署

模型在線部署和調用,實時挖掘數據價值

當模型的預測及評估結果達到目標後,可進行模型在線部署,將模型部署至模型服務器上,並生成模型的調用API。部署後,可進行模型的在線調用。
除以上核心功能外,基礎的租戶隔離、項目創建管理、用戶管理、角色管理、數據接入等也是具備的,可一站式完成機器學習作業,歡迎大家體驗。

使用DTinsight.Science可以做哪些有意思和有價值的事情?

數棧-數據科學平臺 DTinsight.Science可幫助企業構建算法服務能力,服務於企業數據的多樣化應用場景,驅動業務創新發展。常用的應用場景如下:

精準營銷

基於相關數據進行個性化的商品推薦、視頻推薦、旅遊商品推薦、廣告精準投放等。

關係網絡

分析用戶關係網絡,進行人羣關聯,精細化任務畫像,擴大營銷範圍及場景。

庫存優化

分析銷售與庫存關係,幫助企業智能化進貨、退貨,合理使用庫存控件,並保證健康的供應鏈關係。

銷售預測

利用整體的銷售數據,以及單品歷史銷售數據,可進行單品未來的銷售預測,合理的指導門店銷售及鋪貨。

金融風控

金融領域是算法模型應用比較成熟的領域,應用的場景也很多,比如根據個人信用評估,進行貸款發放的預測,貸款還款的預測,進行風險控制,以及屏蔽羊毛黨等營銷場景上的使用。

其他

在不同的行業領域,會有更多的分析場景,如文本分析、圖片分類、視頻分析等。

截止到今天,袋鼠雲企業級一站式數據中臺PaaS-數棧具有數據計算引擎、數據開發平臺、數據科學平臺、數據資產平臺、數據服務引擎等5大產品模塊,平臺覆蓋全鏈路的數據採集、數據分析、數據挖掘、任務運維、數據質量、數據地圖、數據模型、數據API開放等場景,充分滿足企業建設數據中臺過程中的多樣複雜需求。

目前,西湖風景名勝區、西溪溼地、山西商務廳、老闆電器、中金易雲、河南世紀聯華、浙江大學、常州旅遊商貿職業技術學校、寧波圖書館、京東方、福建票付通、觀遠數據、東方龍馬、佰羚數據等客戶和合作伙伴都已經在使用或者參與數棧產品共創。

數棧——企業級—站式數據中臺PaaS

數據計算引擎

提升企業數據共享能力,加速釋放數據價值

離線計算引擎
基於Apache Spark,計算速度比MapReduce快百倍
實時計算引擎
基於Apache Flink,高吞吐、低延遲、高性能

數據開發平臺

一站式大數據開發平臺,快速完全數據中臺搭建

離線計算開發套件
節省80%數據開發時間,全鏈路數據處理,兼容開源、商用計算引擎
實時計算開發套件
金融級流式數據處理自研組件,10倍採集性能,Flink引擎源碼增強
數據同步引擎FlinkX
分佈式多節點併發讀寫,吞吐量高,支持豐富的數據源

數據科學平臺

機器學習作業探索平臺

可視化實驗搭建,集成多種主流計算框架與豐富的算法組件
交互式Notebook開發,提供自由的算法探索環境
模型離線訓練,支持週期調度與任務管理
模型在線部署,支持在線調用模型與更新模型版本

數據資產平臺

構建企業數據資產中心,實現數據管理規範化

數據地圖
可視化數據資產中心,數據全生命週期可知可管
數據質量
覆蓋90%質量校驗場景,雙表逐行校驗保障海量數據一致
數據模型
構建OneData數據模型,快速上手清晰易懂的數據規範

數據服務引擎

提升企業數據共享能力,加速釋放數據價值

數據可視化
讓數據價值看得見,打造新一代“四有”大屏
分析引擎
百億數據實現秒級查詢多維度,頻度複雜分析
數據API
“0代碼”API生成,多權限控制保障數據開放安全

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章