• 关于Hive创建分区目录且能查到数据的三种方法


    关于Hive创建分区目录且能查到数据的三种方法

    1. 使用dfs -mkdir 和 dfs -put 分别创建分区目录和上传数据,此时执行msck repair table 表名 命令就能查询到数据

    1. 使用dfs -mkdir -p /user/hive/warehouse-master/pv_log/day=20191115;创建分区目录

     2. 使用dfs -put /opt/module/hiveTest/pv_15.log /user/hive/warehouse-master/pv_log/day=20191115/ 上传本地数据到分区目录中

    3. 此时select * from pv_log where day='20191115';查询不到20191115这一天的数据

     

    4. 使用msck repair table pv_log;这条修复语句后,再执行查询语句就可查询到20191115这一天的数据

     

    2. 使用dfs -mkdir 和 dfs -put 分别创建分区目录和上传数据,此时执行alter table 表名 add partition(分区目录名) 命令就可查询到数据

    1. 使用dfs -mkdir -p /user/hive/warehouse-master/pv_log/day=20191116;创建分区目录,以及使用dfs -put /opt/module/hiveTest/pv_16.log /user/hive/warehouse-master/pv_log/day=20191116/ 上传本地数据到分区目录中

     2. 此时执行alter table pv_log add partition(day='20191116');语句后,就可查询到数据

     3. 使用dfs -mkdir 创建分区目录,此时执行load data local inpath '本地数据所在的路径' into table 表名 partition(分区目录名);语句后,就可查询到数据

    1. 使用dfs -mkdir -p /user/hive/warehouse-master/pv_log/day=20191117;创建分区目录

     2. 使用load data local inpath '/opt/module/hiveTest/pv_17.log' into table  pv_log partition(day='20191117');语句加载数据后,就能查询到数据

  • 相关阅读:
    localhost 和 127.0.0.1 认识
    postgreSQL可视化工具pgAdmin3 导入表结构和数据
    posgreSQL安装失败解决方案
    C#面向对象基本概念总结
    关于数据存储(关系型数据库和非关系型数据库)
    ADO.NET中的五大内置对象
    关于XML
    WPF中TreeView控件SelectedItemChanged方法的MVVM绑定
    WPF中使用MVVM进行multibinding
    WPF中TreeView控件数据绑定和后台动态添加数据(二)
  • 原文地址:https://www.cnblogs.com/zhangchenchuan/p/11870902.html
Copyright © 2020-2023  润新知