原创 大數據簡答題
目錄 一.Hadoop 1.hdfs寫流程 2.hdfs讀流程 3.hdfs的體系結構 4.一個datanode 宕機,怎麼一個流程恢復 5.hadoop 的 namenode 宕機,怎麼解決 6.namenode對元數據的管理
原创 Spark基礎練習題(RDD)
題目如下👇 1、創建一個1-10數組的RDD,將所有元素*2形成新的RDD 2、創建一個10-20數組的RDD,使用mapPartitions將所有元素*2形成新的RDD 3、創建一個元素爲 1-5 的RDD,運用 flatMap
原创 Kettle(選擇字段Json-excel)
Kettle(選擇字段Json-excel) 原始數據 操作 結果數據
原创 Kettle(增加列Json->excel)
Kettle(增加列Json->excel) 原始數據: 操作 結果數據
原创 Kettle(值映射Json->Excel)
Kettle(值映射Json->Excel) 原數據 操作: 結果數據:
原创 Kettle(數據過濾)
Kettle(過濾) 原始數據 操作 結果數據
原创 Kettle(記錄集連接)
Kettle(記錄集連接) 原始數據 操作 結果數據
原创 Kettle(switch)
Kettle(switch) 結果數據
原创 Kettle(連接控件-笛卡爾積)
Kettle(連接控件-笛卡爾積) 原數據 操作 結果數據
原创 Kettle(執行Hive的HiveSQL語句,使用作業的SQL腳本)
Kettle(執行Hive的HiveSQL語句,使用作業的SQL腳本) 結果數據
原创 Spark中的小案例(RNG S8 失敗後的微博評論)
rng_comment.txt文件中的數據說明 字段 字段含義 index 數據id child_comment 回覆數量 comment_time 評論時間 content 評論內容 da_v 微博
原创 Kettle(讀取Excel表中的輸入到Hive數據庫中的kettle庫中text表)
Kettle(讀取Excel表中的輸入到Hive數據庫中的kettle庫中text表) 原始數據 操作過程 點擊SQL 進行生成hive中的表 生成的數據
原创 Kettle(Hive數據寫到Excel中)
Kettle(Hive數據寫到Excel中) 環境配置 將這個文件複製: 放到 原始數據 重啓Spoon.bat 輸出後的數據
原创 Kettle(讀取json數據寫入到hdfs系統上)
Kettle(讀取json數據寫入到hdfs系統上) 原始數據: 保存執行 輸出結果
原创 Kettle(Json數據寫入到指定的表)
Kettle(Json數據寫入到指定的表) json數據: 輸出後的數據: