Hive中管理表(內部表)和外部表的區別是什麼,及分區表使用場景

Hive中管理表(內部表)和外部表的區別是什麼,及分區表使用場景?


⑴區別:

①Hive創建內部表時(默認創建內部表),會將數據移動到數據倉庫指向的路徑;創建外部表(需要加關鍵字external),僅記錄數據所在的路徑,不對數據的位置做任何改變;

⑵Hive刪除表時,內部表的元數據和數據會被一起刪除,而外部表只刪除元數據,不刪除數據;


⑵場景:

①外部表:比如某個公司的原始日誌數據存放在一個目錄中,多個部門對這些原始數據進行分析,那麼創建外部表是明智選擇,這樣原始數據不會被刪除;

②內部表:對原始數據或比較重要的中間數據進行建表存儲;

③分區表:將每個小時或每天的日誌文件進行分區存儲,可以針對某個特定時間段做業務分析,而不必分析掃描所有數據;

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章