• 课堂测试03


    3、数据分析处理:
    (1)统计每天各个机场的销售数量和销售金额。
    要求的输出字段
    day_id,sale_nbr,,cnt,round
    日期编号,卖出方代码,数量,金额
     (2)统计每天各个代理商的销售数量和销售金额。
    要求的输出字段
    day_id,sale_nbr,,cnt,round
    日期编号,卖出方代码,数量,金额
    (3)统计每天各个代理商的销售活跃度。
    要求的输出字段
    day_id,sale_nbr, sale_number
    日期编号,卖出方代码,交易次数(买入或者卖出均算交易次数)
    (4)汇总统计 9 月 1 日到 9 月 15 日之间各个代理商的销售利润。
    编号,卖出方代码,买入数量,买入金额,卖出数量,卖出金额,销售利润(卖出
    金额-买入金额)
     (5)设计分析代理商的市场地位根据市场交易次数、交易对象个数、销售机票数量、
    销售利润等。(选做题)

    (1) 统计每天各个机场的销售数量和销售金额

    首先创建一个存储该数据的表text3_1

    Create table text3_1(day_id varchar(30), sale_nbr varchar(30), cnt varchar(30), round varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

        (

            "separatorChar"=","

        )

    STORED AS TEXTFILE;

     

    然后将查询的数据存储到该表

    insert overwrite table text3_1

    SELECT

      day_id,

      sale_nbr,

      SUM(cnt),

      SUM(round)

    FROM

      test3

    WHERE sale_nbr LIKE 'C%'

    GROUP BY day_id,sale_nbr;

     

     

    2)统计每天各个代理商的销售数量和销售金额

    首先创建一个存储该数据的表text3_2

    Create table text3_2(day_id varchar(30), sale_nbr varchar(30), cnt varchar(30), round varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

        (

            "separatorChar"=","

        )

    STORED AS TEXTFILE;

     

    然后将查询的数据存储到该表

    insert overwrite table text3_2

    SELECT

      day_id,

      sale_nbr,

       SUM(cnt),

      SUM(round)

    FROM

      test3

    WHERE sale_nbr LIKE "O%"

    GROUP BY day_id,sale_nbr;

     

     

    3)统计每天各个代理商的销售活跃度

    首先创建一个存储该数据的表text3_3

    Create table text3_3(day_id varchar(30), sale_nbr varchar(30), sale_number varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES

        (

            "separatorChar"=","

        )

    STORED AS TEXTFILE;

     

    然后将查询的数据存储到该表

    insert overwrite table text3_3

    SELECT

      day_id,

      sale_nbr,

      COUNT(sale_nbr)

    FROM

      test3

    WHERE sale_nbr LIKE "O%"

    GROUP BY day_id,sale_nbr;

     

     

  • 相关阅读:
    王者齐聚!Unite 2017 Shanghai 日程讲师全揭晓
    微软在.NET官网上线.NET 架构指南频道
    期待微软平台即服务技术Service Fabric 开源
    Visual Studio 20周年软件趋势随想
    .NET 十五岁,谈谈我眼中的.NET
    API网关Ocelot 使用Polly 处理部分失败问题
    互联网背景下知识半衰期这么短,如何学习?
    CentOS 7 上面安装PowerShell
    搭建consul 集群
    Entity Framework Core 实现MySQL 的TimeStamp/RowVersion 并发控制
  • 原文地址:https://www.cnblogs.com/wrljzb/p/15639751.html
Copyright © 2020-2023  润新知