• hive 分区表


    hive 表数据复合 struts类型

    STRUCT{a INT; b INT} 通过 c.a 来获得 a的值

    create table test1(id INT, info struct<name:STRING, age:INT, sources:Double>) 
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' COLLECTION ITEMS TERMINATED BY ':';

    Array类型

    array A中元素['a','b','c'],则A[1]的值为'b'
    create table test2(name string, stu_id Array<INT>)
    ROW FORMAT DELIMITED  FIELDS TERMINATED BY ','  COLLECTION ITEMS TERMINATED BY ':';

     Map类型 包含了 key ->value 通过 key 获得value的值

    create table test3(id string, perf map<string, int>) 
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' COLLECTION ITEMS TERMINATED BY ',' MAP KEYS TERMINATED BY ':';

    hive 不布隆滤器一个行健查询,一个列都可以实现, 布隆占用内存空间很小

    布隆过滤器可以实现缓存查询,如果查询不在再到磁盘查询

  • 相关阅读:
    linux umask使用详解
    Linux 解压压缩命令
    linux命令:tail 命令
    linux命令:head 命令
    linux下cat命令详解
    linux命令:rm 命令
    linux命令:mv命令
    Linux 的cp命令
    文件权限详解
    Linux ls命令参数详解
  • 原文地址:https://www.cnblogs.com/zhanggl/p/4994220.html
Copyright © 2020-2023  润新知