• 2020寒假学习记录(13)——实验5 SparkSQL基本操作


    将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。

    { "id":1 , "name":" Ella" , "age":36 }

    { "id":2, "name":"Bob","age":29 }

    { "id":3 , "name":"Jack","age":29 }

    { "id":4 , "name":"Jim","age":28 }

    { "id":4 , "name":"Jim","age":28 }

    { "id":5 , "name":"Damon" }

    { "id":5 , "name":"Damon" }

    为 employee.json 创建 DataFrame,并写出 Scala 语句完成下列操作。

    创建DataFrame

    1.查询所有数据。

     

    2.查询所有数据并去除重复的数据。

     

    3.查询所有数据,打印时去除id字段。

     

    4.将数据按age分组

     

    5.将数据按name升序排列

     

    6.筛选出age>30的记录

     

    7.取出前三行数据

     

    8.查询所有记录的name列,并为其去别名为username

     

    9.查询年龄age的平均值

     

    10.查询年龄age的最小值。

     

  • 相关阅读:
    假期学习01
    构建之法读后感(二)
    构建之法读后感(一)
    每日日报
    每日日报
    每日日报
    每日日报
    每日日报
    每周日报
    每日日报
  • 原文地址:https://www.cnblogs.com/Qi77/p/12323962.html
Copyright © 2020-2023  润新知