hive之存儲數據格式

  在項目中使用到了hive,本來覺得挺簡單的無非就是CRUD,慢慢發現不是那麼回事。特開文章來記錄下來以備後查。

  在使用傳統的數據庫時因爲封裝的很好,屏蔽了許多底層細節,所以在使用時只需關注應用的開發無需關注底層的實現。在使用hive時就沒那麼簡單了,需要考慮方方面面的內容。

   這裏先記錄下hive在數據存儲時的存儲格式,一共有三種格式:TEXTFILE,SEQUENCEFILE,RCFILE

   hive默認的存儲格式爲textfile既文本格式,後兩種格式爲二進制格式,行列混合格式。

   hive指定文件的存儲格式有兩種方式:1.在創建表時的SQL語句指定。2.在hive的hive-site.xml文件中配置成全局變量,如果在創建表時不顯式指定文件存儲格式就會使用指定的文件格式。

   下面舉例來說明

   1.創建表時SQL語句指定

    CREATE TABLE TEST (name string,age int) STORED AS RCFILE;

  2.

  

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章