hive的内置函数和自定义函数

一、内置函数

　　1.一般常用函数　　

1.取整函数
    round（）  当传入第二个参数则为精度
    bround（） 银行家舍入法：为5时，前一位为偶则舍，奇则进。
2.向下取整
    floor（）
3.向上取整
    ceil/ceiling（）
4.生成随机数
    rand （）   范围[0,1),传入种子时生成稳定随机数
5.自然指数函数
    exp （）   e的n次方
    log10 ()   10为底的对数函数
    ln（）     e为底的对数函数
    log（base，v）base为底的函数
6.幂函数
    pow/power (base,exponent)
7.根函数
    aqrt（）    开平发
    cbrt（）    开立方
8.绝对值函数
    abs（）
9.进制转换
    bin（）                转二进制
    hex（）                转十六进制
    unhex（）            反转十六进制
    conv（v，from，to）    进制转换函数
10时间函数
    unix_timestamp（）              获取时间
    from_unixtime（ut，formats）    ut转为日期字符串
    unix_timestamp（timestr，fs）    日期转化ut
    to_data（timestr）                返回日期部分
    year（timestr）                    返回指定部分，其他类似
    datediff（endDate，startD）        日期比较函数（返回日期之间的天数）
    date_add(startDate,days)        日期增加，返回当前日期计算后的日期字符串
    date_sub(startDate,days)        日期减少

View Code

　　2.字符串常用函数

1.取长度
    length（）
2.反转
    reverse（）
3.字符串连接函数
    concat（strS）                    无分隔符连接
    concat_ws（separator，strS）    分隔符连接
4.字符串截取
    substr/substring(str,index)     为正截取至此，为负截取后index个
    ~~~~（str,index,length）        从index截取length个字符，正左负右
5.大小写转换
    upper/ucase ()
    lower/lcase ()
6.去空格函数
    trim（）                        两边去空格
    ltrim（）                        左边去空格
    rtrim（）                        右边去空格
7.正则表达式
    regexp_replace(str,rge,replace)    替换字符串
    regexp_extract(str,reg,index)    查找匹配字符，0返回全部，1返回第一个括号里的
8.URL解析函数
    parse_url (str，’{extractPart}’[，’{extractKey}’])
    选项有：[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]
    select parse_url('http://facebook.com/path/p1.php?query=1', 'HOST') from dual;---facebook.com
9.json函数
    get_json_object(jsonstr,'$.name')
10.字符串生成和补足函数
    space（n）                  空字符串
    repeat（str，n）                重复字符串
    lpad（str,legth,addstr）        左补足
    split（str,splitstr）            字符串分割

View Code

二、自定义函数

自定义函数加载步骤 -> 只对当前会话有效
(1)新建项目 - JavaProject
(2)将hive-exec-1.2.2.jar添加至构建路径中
(3)新建包 -> 新建类(继承UDF)
(4)新建方法evaluate -> 指定返回值类型和参数列表
(5)导出项目 -> jar包(只需要包含src下的内容)
(6)上传jar包至Linux系统
(7)打开Hive会话
(8)加载jar包：add jar /home/bigdata/udf.jar; -> 将jar包添加至构建路径(类的搜索加载路径)
(9)将jar包中的类进行函数的命名
create temporary function sub as 'com.sand.udf.SubString';
(10)show functions; -> 验证是否添加成功

三、创建虚表

为了方便测试，可仿照oracle创建dual表
1.新建一个dual表
	create table dual（dummy string）；
2.创建仅包含X的文件
	echo X >/home/hadoop/dual.txt
3.上传数据
	load data local inpath '/home/hadoop/dual.txt' overwrite into table dual;
4.测试
	select 1+1 from dual ;  返回2则成功

相关阅读:
美团大数据质量监控平台
 大数据理论体系总结--数据仓库管理与全链路数据体系
 spark图解
 forEach、map、filter、find、sort、some等易错点整理
 轮播图(jQuery)
js 数组、对象转json 以及 json转数组、对象
 jquery 获取元素(父节点,子节点,兄弟节点),元素筛选
 前端面试总结 (转 0C°)
Git入门看这一篇就够了！ (转)
Rotating Scoreboard POJ
原文地址：https://www.cnblogs.com/OnTheWay-0518/p/9649226.html