Hive中管理表(內部表)和外部表的區別是什麼,及分區表使用場景?
⑴區別:
①Hive創建內部表時(默認創建內部表),會將數據移動到數據倉庫指向的路徑;創建外部表(需要加關鍵字external),僅記錄數據所在的路徑,不對數據的位置做任何改變;
⑵Hive刪除表時,內部表的元數據和數據會被一起刪除,而外部表只刪除元數據,不刪除數據;
⑵場景:
①外部表:比如某個公司的原始日誌數據存放在一個目錄中,多個部門對這些原始數據進行分析,那麼創建外部表是明智選擇,這樣原始數據不會被刪除;
②內部表:對原始數據或比較重要的中間數據進行建表存儲;
③分區表:將每個小時或每天的日誌文件進行分區存儲,可以針對某個特定時間段做業務分析,而不必分析掃描所有數據;