创建分区表
1.ORIENTATION
决定了表的数据的存储方式。
取值范围:
COLUMN:表的数据将以列式存储。
ROW(缺省值):表的数据将以行式存储。
ORC:表的数据将以ORC格式存储(仅HDFS表)。
注意:
orientation不支持修改
2.COMPRESSION
列存表的有效值为LOW/MIDDLE/HIGH/YES/NO,压缩级别依次升高,默认值为LOW。
行存表的有效值为YES/NO,默认值为NO。
HDFS表的有效值为ZLIB/SNAPPY/NO,ZLIB的压缩比大于SNAPPY,默认值为SNAPPY。
3.PARTITION BY RANGE(partition_key)
创建范围分区。partition_key为分区键的名称。
4.PARTITION partition_name VALUES LESS THAN ( { partition_value | MAXVALUE } )
指定各分区的信息。partition_name为范围分区的名称。partition_value为范围分区的上边界,取值依赖于partition_key的类型。MAXVALUE表示分区的上边界,它通常用于设置最后一个范围分区的上边界。
注意点:
每个分区都需要制定一个边界
上边界的类型应该和分区键的类型一致
分区列表按照分区上边界升序排列,值较小的位于值较大的分区之前