Hive的定义及搭建

Hive的定义及搭建
1.定义　　

　　Apache Hive数据仓库软件便于读，写和管理大型数据集驻留在分布式存储使用SQL。

　　结构可以投影到存储中的数据上。

　　客户端的连接方式可采用：command line 和 JDBC Driver。

注意：Hive实质就是客户端，不存在主从结构，搭建过程没有集群概念。

2.搭建Hive

　　前提：

　　　　 a.Hadoop集群搭建完成！

　　　　 b.start-dfs.sh 开启HDFS

　　　　　　start-yarn.sh 开启yarn

　　1.安装java

　　2.安装Hadoop

　　3.安装Hive

　　　　a.上传并解压　　

　　　　b.配置环境变量

　　4.开启集群相关服务

　　5.进入Hive

　　　　$>hive

　　6.测试

　　　　hive>show databases;

　　　　hive>use default;

　　　　hive>show tables;

　　　　hive>create table test(id int,name string);

　　　　hive>insert into test values(1,'lisi');

　　　　hive>select * from test;

　　　　hive>drop table test;

3.数据仓库和数据库

　　关系型数据库：OLTP联机事务处理：ACID，实时处理。

　　数据仓库：OLAP联机分析处理：统计，处理和加工（分析操作），离线处理，大数据集。
相关阅读:
程序员的成长
 存储系统的基本数据结构之一: 跳表 (SkipList)
【机器学习-斯坦福】学习笔记3
TCP/IP入门(3) --传输层
 2015华为暑期实习（北京）面试经验
 C++面试中关于sizeof问题总结
 KMP详解
 hihoCoder #1014 : Trie树
 Trie树的创建、插入、查询的实现
 Trie树（c++实现）
原文地址：https://www.cnblogs.com/lyr999736/p/9467721.html