• Hive的定义及搭建


    1.定义  

      Apache Hive数据仓库软件便于读,写和管理大型数据集驻留在分布式存储使用SQL。

      结构可以投影到存储中的数据上。

      客户端的连接方式可采用:command line 和 JDBC Driver。

    注意:Hive实质就是客户端,不存在主从结构,搭建过程没有集群概念。

    2.搭建Hive

      前提:

           a.Hadoop集群搭建完成!

           b.start-dfs.sh 开启HDFS

          start-yarn.sh 开启yarn

      1.安装java

      2.安装Hadoop

      3.安装Hive

        a.上传并解压  

        b.配置环境变量

      4.开启集群相关服务

      5.进入Hive

        $>hive

      6.测试

        hive>show databases;

        hive>use default;

        hive>show tables;

        hive>create table test(id int,name string);

        hive>insert into test values(1,'lisi');

        hive>select * from test;

        hive>drop table test;

    3.数据仓库和数据库

      关系型数据库:OLTP联机事务处理:ACID,实时处理。

      数据仓库:OLAP联机分析处理:统计,处理和加工(分析操作),离线处理,大数据集。


     

  • 相关阅读:
    程序员的成长
    存储系统的基本数据结构之一: 跳表 (SkipList)
    【机器学习-斯坦福】学习笔记3
    TCP/IP入门(3) --传输层
    2015华为暑期实习(北京)面试经验
    C++面试中关于sizeof问题总结
    KMP详解
    hihoCoder #1014 : Trie树
    Trie树的创建、插入、查询的实现
    Trie树(c++实现)
  • 原文地址:https://www.cnblogs.com/lyr999736/p/9467721.html
Copyright © 2020-2023  润新知