• hive的使用和深化理解


    1.hive中的数据最终是存放在hdfs上的

    2.hive本身不是关系型数据库,hive执行sql语句时会把sql语句翻译成mapreduce程序,然后将mapreduce程序提交到hadoop集群中去执行mapreduce程序

    3.bin目录下启动hive:./hive后

    hive>

    接下来导入数据

    vi emp.txt

    hive>load data local inpath '/root/emp.txt' into table t_emp;

    导入数据以后,可以在/user下看到一个hive目录,因为之前配置好了环境变量,它可以知道Hadoop在哪里,读取Hadoop的配置文件

    在HDFS中找目录:/user/hive/warehouse/t_emp,可以找到一个emp.txt文件

    所以hive的数据最终在HDFS上

    hive>select count(*) from t_emp;

      select count(*) from t_emp where dept_name='销售部' group by dept_name;

      相当于把sql语句转换成mapreduce程序进行执行

      desc t_emp;(可以看到表结构)

     select * from t_emp;(只有查所有数据的时候才不会执行mapreduce,而是将整张表列出来)

  • 相关阅读:
    家庭问题(family)
    BFS简单题记
    【例2-3】围圈报数
    【例8.3】最少步数
    【例3-5】扩展二叉树
    股票买卖
    小球(drop)
    用循环单链表实现约瑟夫环
    二叉树的3种遍历6种实现
    const与#define宏常量 , inline与#define
  • 原文地址:https://www.cnblogs.com/Mandylover/p/5210705.html
Copyright © 2020-2023  润新知