Hive使用

CREATE TABLE A (X STRING);

CREATE TABLE () 语句已经定义完成。数据库定义完成。进行直接解释

select找一张表的流程

表所在的库--->在库下找所在的表

HIVE CREATE TABLE A (wangxiaojia int);

MYSQL INERT INTO HIVE.TBLS values (db_num,A,timestamp,col).....

HIVE的连接模式== 本地连接模式 直接启动hive命令

HIVE的远程连接 这里要启动HIVE的服务 thirft进行编写

hiveserver2 ---- > 前台启动 后台启动

前台启动 hiveserver2

后台启动 hiveserver2 &

beeline

!connect jdbc:hive2://192.168.16.100:10000

beeline -u jdbc:hive2://192.168.16.100:10000 -n root

两种删除数据的方法：

delete

truncate HIVE中删除数据 truncate是删除表中所有的数据

HIVE的分区表

create table test (id int, name string,tel string) partitioned by (age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE;

create table test1 (id int, name string,tel string,age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE;

HIVE中的分区表

HIVE数据库是支持分区表的，但是这里我们注意的是两点

一 分区表中的分区列 必须单列出来

二 分区列存放数据的位置和其他数据不在一起 在一个单独的目录下

静态分区插入数据：

insert overwrite table test PARTITION (age=25) select id, name, tel from test3;

动态分区插入数据：

set hive.exec.mode.local.auto=true;

set hive.exec.dynamic.partition.mode=nonstrict;

insert overwrite table test PARTITION (age) select id, name, tel, age from test3;

6 bsr2 134535353535 22

7 bsr3 132453535353 24

8 bsr4 154243434355 25

1 bsr 13188888888888 25

2 test 13888888888888 27

3 zs 899314121 29

create table test_buk (id int, name string,tel string,age int)

clustered by(id) sorted by(age) into 2 buckets

row format delimited fields terminated by '	';

set hive.enforce.bucketing = true;

load data local inpath '/root/student.txt' into test_buk;

insert overwrite table test_buk

select id,name,tel,age from test3 distribute by(id) sort by(age);

能力测试

create table test_cou (id int, name string,tel string)

partitioned by (age int)

clustered by(id) sorted by(tel) into 2 buckets

row format delimited fields terminated by '	';

第一满足动态分区 第二分桶不能出错

set hive.exec.mode.local.auto=true;

set hive.exec.dynamic.partition.mode=nonstrict;

set hive.enforce.bucketing = true;

insert overwrite table test_cou PARTITION (age)

select id, name, tel, age from test3 distribute by(id) sort by(tel);

相关阅读:
BigTale
GFS Google File System(中文翻译)
MapReduce
Google MapReduce/GFS/BigTable三大技术的论文中译版
Linux常用命令大全
linux常用命令
Oracle复杂查询
jquery on事件jquery on实现绑定多个事件
Java 多线程（六） synchronized关键字详解
什么才算是真正的编程能力？

原文地址：https://www.cnblogs.com/dasiji/p/11245520.html