• Hive数据分析(二)


    数据清洗:

    一、要求

    要求将 day_id 一列中的数值清洗为真实的日期格式,可用字符串表示。

    数据 1 对应日期 2021-09-01,依次类推,15 对应日期 2021-09-15


    二、操作

    1、创建表格存放清洗后的数据:

    create table sales_y(day_id string,sale_nbr string,buy_nbr string,cnt string,round string)

    row format delimited fields terminated by ',';

    2、插入清洗后的数据:

    insert overwrite table sales_y select date_add('2021-09-00',cast(day_id as int)) as day_id,sale_nbr as sale_nbr,buy_nbr as buy_nbr,cnt as cnt,round as round from sales;

     3、查看结果

    select * from sales_y limit 10;


    三、总结

    1、DATE_ADD() 函数

    作用:向日期添加指定的时间间隔。

    语法:DATE_ADD(date,INTERVAL expr type)

    参数:

    • date 参数是合法的日期表达式

    • expr 参数是您希望添加的时间间隔。

    2、CAST()函数

    作用:用于将某种数据类型的表达式显式转换为另一种数据类型。CAST()函数的参数是一个表达式,它包括用AS关键字分隔的源值和目标数据类型。

    语法:CAST (expression AS data_type)

    参数:

    • expression:任何有效的SQServer表达式。

    • AS:用于分隔两个参数,在AS之前的是要处理的数据,在AS之后是要转换的数据类型。

    • data_type:目标系统所提供的数据类型,包括bigint和sql_variant,不能使用用户定义的数据类型。

     

  • 相关阅读:
    将一个类的Lambda转换成另一个类的研究
    欧拉计划 第10题
    C#4.0泛型中的out使用
    WP7应用开发笔记(4) 圆形滑动控件实现
    欧拉计划 第6题
    欧拉计划 第一题
    助手系列之python的FTP服务器
    Visual C++ 2008进行MySQL编程
    通过FTP命令上传下载
    助手系列之连接mysql数据库
  • 原文地址:https://www.cnblogs.com/znjy/p/15380139.html
Copyright © 2020-2023  润新知