• 用mapreduce 处理气象数据集


      用mapreduce 处理气象数据集

    编写程序求每日最高最低气温,区间最高最低气温

    1. 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa
    2. 按学号后三位下载不同年份月份的数据(例如201506110187号同学,就下载2018年以7开头的数据,看具体数据情况稍有变通)
    3. 解压数据集,并保存在文本文件中                                                            
    4. 对气象数据格式进行解析                                                                     
    5. 编写map函数,reduce函数                                                                                                                                                                                                                                                                                                     
    6. 将其权限作出相应修改                                                                              
    7. 本机上测试运行代码                                                                                         
    8. 放到HDFS上运行
      1. 将之前爬取的文本文件上传到hdfs上                                                                                
      2. 用Hadoop Streaming命令提交任务                                                                                                                           

    9. 查看运行结果                                                                                                                                                                                                                                                    最低气温                                                                   
  • 相关阅读:
    Excel 用row()函数 在Excel中自动添加序号,
    sql server数据导入
    Excel导入sq server后数据列以科学计数法显示
    left join 和 left outer join 的区别
    多点求值与暴力插值
    生成函数

    洲阁筛 学习笔记
    「NOI2017」游戏 解题报告
    CF 1045 H. Self-exploration 解题报告
  • 原文地址:https://www.cnblogs.com/stcy520/p/9016234.html
Copyright © 2020-2023  润新知