hive中修改序列化格式分隔符

SerDe

SerDe 是 Serialize/Deserilize 的简称,目的是用于序列化和反序列化。序列化的格式包括:

  • 分隔符(tab、逗号、CTRL-A)
  • Thrift 协议

反序列化(内存内):

  • Java Integer/String/ArrayList/HashMap
  • Hadoop Writable 类
  • 用户自定义类
查看表结构方法有两种:
  1. desc tableName
  2. desc formatted tableName
修改表中的序列化分隔符:
hive> alter table store set SERDEPROPERTIES('field.delim'='\t');

参考资料:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTableProperties


你可能感兴趣的:(hadoop)