• hive笔记


    set hive.cli.print.header=true;
    -- 显示字段名称
    set hive.cli.print.current.db=true;
    -- 显示当前数据库名
    drop database dbname CASCADE;
    -- 删除数据库及库中表
    alter database dbname set dbproperties(key=value);
    -- 设置数据库元数据
    alter table table_name set tblproperties('creator'='wangbin');
    alter table table_name set tblproperties('EXTERNAL'='FALSE');    
    -- 注意大写的单词外部表转内部表
    alter table table_name set serdeproperties('field.delim'='	');
    -- 修改序列化信息
    alter table table_name partition(dt='') set fileformat sequencefile;
    -- 修改表的存储属性
    alter table table_name partition(dt='') set location 'hdfs://...';
    -- 修改表存储位置
    insert overwrite directory 'hdfs://...' select  *  from table_name;
    -- 将查询数据导入到一个hdfs目录
    order by 
    --全局排序
    sort by 
    --局部(每个reducer)排序
    distribute by + 字段 
    --控制相同字段的map输出会发到一个reduce
    cluster by 
    --等价于distribute by +sort by 
    left semi join 
    -- 左半连接,只返回左表中符合on条件的数据
  • 相关阅读:
    docker容器之启动容器
    docker镜像之registry
    docker镜像之镜像命名
    习题3
    习题二(1)
    课堂作业4
    课堂作业(电费)
    课堂作业2
    实验4
    实验3
  • 原文地址:https://www.cnblogs.com/wangbin2188/p/10366126.html
Copyright © 2020-2023  润新知