Hive_Rank

1．函数说明

RANK()：

　　排序相同时会重复，总数不会变

DENSE_RANK()：

　　排序相同时会重复，总数会减少

ROW_NUMBER()：

　　会根据顺序计算

2．数据准备

name	subject	score
孙悟空	语文	87
孙悟空	数学	95
孙悟空	英语	68
大海	语文	94
大海	数学	56
大海	英语	84
宋宋	语文	64
宋宋	数学	86
宋宋	英语	84
婷婷	语文	65
婷婷	数学	85
婷婷	英语	78

3．需求

计算每门学科成绩排名。

4．创建本地score.txt，导入数据

[hadoop@hadoop102 datas]$ vi score.txt

5．创建hive表并导入数据

create table score(
name string,
subject string, 
score int) 
row format delimited fields terminated by "	";
load data local inpath '/opt/module/datas/score.txt' into table score;

6．按需求查询数据

select name,
subject,
score,
rank() over(partition by subject order by score desc) rp,
dense_rank() over(partition by subject order by score desc) drp,
row_number() over(partition by subject order by score desc) rmp
from score;

name    subject score   rp      drp     rmp
孙悟空  数学    95      1       1       1
宋宋    数学    86      2       2       2
婷婷    数学    85      3       3       3
大海    数学    56      4       4       4
宋宋    英语    84      1       1       1
大海    英语    84      1       1       2
婷婷    英语    78      3       2       3
孙悟空  英语    68      4       3       4
大海    语文    94      1       1       1
孙悟空  语文    87      2       2       2
婷婷    语文    65      3       3       3
宋宋    语文    64      4       4       4

扩展：求出每门学科前三名的学生？

select name,

subject,

score,

rank() over(partition by subject order by score desc) rp,

dense_rank() over(partition by subject order by score desc) drp,

row_number() over(partition by subject order by score desc) rmp

from score;

name subject score rp drp rmp

孙悟空数学 95 1 1 1

宋宋数学 86 2 2 2

婷婷数学 85 3 3 3

大海数学 56 4 4 4

宋宋英语 84 1 1 1

大海英语 84 1 1 2

婷婷英语 78 3 2 3

孙悟空英语 68 4 3 4

大海语文 94 1 1 1

孙悟空语文 87 2 2 2

婷婷语文 65 3 3 3

宋宋语文 64 4 4 4

学习中，博客都是自己学习用的笔记，持续更新改正。。。

相关阅读:
2251: [2010Beijing Wc]外星联络
1500 后缀排序
1492: [NOI2007]货币兑换Cash【CDQ分治】
P3380 【模板】二逼平衡树（树套树）
python opencv
pycharm调试
pycharm中选择python interpreter
创建使用pycharm virtualenv
reload函数
python3编写发送四种http请求的脚本

原文地址：https://www.cnblogs.com/Tunan-Ki/p/11808598.html