cdh全稱爲Cloudera’s Distribution Including Apache Hadoop
Scheduler定時器
看圖說話
然後點擊保存
創建數據表
Sql化操作
create external table if not exists catch_plan (
user string,
date string,
name string
)
row format delimited fields terminated by '|'
location '/user/liuxunming/plan'
inner join(等值連接) 只返回兩個表中聯結字段相等的行
left join(左聯接) 返回包括左表中的所有記錄和右表中聯結字段相等的記錄
right join(右聯接) 返回包括右表中的所有記錄和左表中聯結字段相等的記錄
界面化操作
在數據庫列表上,點擊這個加號按鈕就是新建數據庫,要是進入數據庫的表的列表界面,點擊加號就是新建數據表
這個地方選擇manually,意爲手動的
這裏主要是選擇文件路徑和分隔符,目前只成功用過豎線pipe和tab
添加所需字段後,點擊提交即可看到成功創建一張表
關於導入的文件中編碼的問題:要確保源文件的編碼是正確的,比如是utf-8
vim模式下查看文件編碼:
:set fileencoding
關於導入文件的格式問題:目前用的最多的是text,其次是csv和json