企業使用Hadoop的真實案列:《Hadoop企業應用實戰》

課 程 名 稱                                                                                                                            

《Hadoop企業應用實戰》——企業使用Hadoop的真實案列

詳情鏈接:http://www.chinahadoop.cn/course/33

時 間                                                                                                                                    

第一期 5月12日-6月21日共八週

培 訓 方 式                                                                                                                            

視頻學習 + 在線答疑 + 每週作業 + 結業考試

培 訓 價 格                                                                                                                            

599元  5月5日之前
¥ 649元  5月6日——5月8日
¥ 699元  5月9日——5月11日


授 課 對 象                                                                                                                            

商業智能(BI)和企業數據倉庫(EDW)的管理人員、建模人員、分析和開發人員、系統管理員等;

有意將Hadoop生態系統中的組件,作爲現有EDW的補充,或未來替代產品的項目負責人及開發人員;

企業中牽涉到大數據處理的數據中心運行、規劃、設計負責人;

Hadoop企業級應用、整合項目的成員、負責人、開發人員;

熟悉Hadoop生態系統,想了解和學習Hadoop企業應用實戰案例的朋友。

課 程 大 綱                                                                                                                          

本課程目標是:給大家分享一些不能在網上隨便一搜就搜到的內容和竅門,展示幾個真實企業應用中的Hadoop成功案例

第一週:企業級Hadoop應用概述,Hadoop生態系統與現有企業級應用的整合

  1. 企業級集羣部署、數據管理、任務調度、集羣監控

  2. Hadoop現有架構的種種問題和限制,HA

  3. 企業數據倉庫的選型,Hadoop世界與EDW世界中的TPC(TPC DS與TPC H

  4. Hadoop世界中的DBA

  5. 成本考量 —— 人?物?物是人非……


第二週:Hadoop Eco System 進階應用基礎知識
  1. HDFS / MapReduce / Yarn / Hive / Impala/Oozie 進階應用、資源分配及調優

  2. 玩轉Hive ETL高級應用:external  table、partition

  3. Hive的Windowing and Analytics Functions

  4. Hive 0.13的新功能

  5. Impala與Hive對比,各種Hints:Hive的Map Join,Impala的SHUFFLE Join(partitioned join)


第三週:進階應用實例 — 初級
  1. 基於用戶行爲記錄分析的用戶個性化標籤

  2. ——廣告/電商行業Hadoop企業級大數據應用方案


第四周:Hadoop Eco System 進階應用基礎知識
  1. HBase / ZooKeeper / Sqoop / Graphite/ Ganglia 進階應用及調優,Spark / Shark簡介

  2. HBase Coprocessor介紹、開發與測試

  3. HBase與Hive的整合高級應用:binary(byte) value,lateral view explode

  4. Hive 0.13:posexplode

  5. Spark / Shark開發介紹


第五週:進階應用實例 — 中級
  1. Hadoop生態系統中爲企業級開發提供的測試框架應用實例

  2. 與Continuous Integration系統整合的可能

  3. ——軟件/互聯網行業Hadoop企業級開發框架


第六週:Hadoop Eco System 企業級應用整合
  1. HBase與Hive整合的大坑

  2. HBase的Region進階應用Compact、Split與Merge

  3. HBase Coprocessor與HBase + Hive分別適用的場景

  4. 與現有企業級BI平臺的整合

  5. 企業中應用HiveImpalaSpark / Shark的注意事項,資源分配方案

  6. Pentaho PDI / Kettle

  7. Oracle or In-Memory Database

  8. MicroStrategy / Tableau


第七週:進階應用實例 — 高級
  1. 整合Hadoop與現有RDBMS的企業級BI解決方案

  2. —— 互聯網行業Hadoop企業級大數據BI應用整合方案


第八週:總結與展望
  1. 現有幾大Hadoop平臺比較:Cloudera CDH,Hortonworks HDP,MapR

  2. CEP?Rule Engine?Stream processing?

  3. Hadoop大數據還能幹什麼?

  4. 金融 / 工業 / 能源 / Smart Data

  5. 德國汽車、新能源行業的大數據創新項目分享


主講人:邱騰                                                                                                                        


專注於BI大數據架構及解決方案,精通網絡數據、市場數據分析,早年泡過sunnet IRC,架過firebird BBS。
06年曾任職於新浪網絡系統部,後轉戰德國科研機構Fraunhofer;
08年開始接觸
hadoop/MapReduce,曾主導項目,通過整合Hadoop的各種組件使德國聯盟廣告商Zanox公司將海量tracking數據轉化爲DMP併成功與多家RTB和DSP平臺對接。
現在歐洲最大的電商平臺德國Zalando公司任大數據架構師


詳情鏈接: http://www.chinahadoop.cn/course/33



在線諮詢:                                                                                                                                                        

QQ羣:306660272

電話:15611440609
郵件:[email protected]


微信公衆號:ChinaHadoop

13090956d5c1016179.jpg?2.0.3


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章