hive中修改序列化格式分隔符

SerDe

SerDe 是 Serialize/Deserilize 的簡稱,目的是用於序列化和反序列化。序列化的格式包括:

  • 分隔符(tab、逗號、CTRL-A)
  • Thrift 協議

反序列化(內存內):

  • Java Integer/String/ArrayList/HashMap
  • Hadoop Writable 類
  • 用戶自定義類
查看錶結構方法有兩種:
  1. desc tableName
  2. desc formatted tableName
修改表中的序列化分隔符:
hive> alter table store set SERDEPROPERTIES('field.delim'='\t');

參考資料:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTableProperties


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章