原创 大數據簡答題

目錄 一.Hadoop 1.hdfs寫流程 2.hdfs讀流程 3.hdfs的體系結構 4.一個datanode 宕機,怎麼一個流程恢復 5.hadoop 的 namenode 宕機,怎麼解決 6.namenode對元數據的管理

原创 Spark基礎練習題(RDD)

題目如下👇 1、創建一個1-10數組的RDD,將所有元素*2形成新的RDD 2、創建一個10-20數組的RDD,使用mapPartitions將所有元素*2形成新的RDD 3、創建一個元素爲 1-5 的RDD,運用 flatMap

原创 Kettle(選擇字段Json-excel)

Kettle(選擇字段Json-excel) 原始數據 操作 結果數據

原创 Kettle(增加列Json->excel)

Kettle(增加列Json->excel) 原始數據: 操作 結果數據

原创 Kettle(值映射Json->Excel)

Kettle(值映射Json->Excel) 原數據 操作: 結果數據:

原创 Kettle(數據過濾)

Kettle(過濾) 原始數據 操作 結果數據

原创 Kettle(記錄集連接)

Kettle(記錄集連接) 原始數據 操作 結果數據

原创 Kettle(switch)

Kettle(switch) 結果數據

原创 Kettle(連接控件-笛卡爾積)

Kettle(連接控件-笛卡爾積) 原數據 操作 結果數據

原创 Kettle(執行Hive的HiveSQL語句,使用作業的SQL腳本)

Kettle(執行Hive的HiveSQL語句,使用作業的SQL腳本) 結果數據

原创 Spark中的小案例(RNG S8 失敗後的微博評論)

rng_comment.txt文件中的數據說明 字段 字段含義 index 數據id child_comment 回覆數量 comment_time 評論時間 content 評論內容 da_v 微博

原创 Kettle(讀取Excel表中的輸入到Hive數據庫中的kettle庫中text表)

Kettle(讀取Excel表中的輸入到Hive數據庫中的kettle庫中text表) 原始數據 操作過程 點擊SQL 進行生成hive中的表 生成的數據

原创 Kettle(Hive數據寫到Excel中)

Kettle(Hive數據寫到Excel中) 環境配置 將這個文件複製: 放到 原始數據 重啓Spoon.bat 輸出後的數據

原创 Kettle(讀取json數據寫入到hdfs系統上)

Kettle(讀取json數據寫入到hdfs系統上) 原始數據: 保存執行 輸出結果

原创 Kettle(Json數據寫入到指定的表)

Kettle(Json數據寫入到指定的表) json數據: 輸出後的數據: