• 用mapreduce 处理气象数据集


      用mapreduce 处理气象数据集

    编写程序求每日最高最低气温,区间最高最低气温

    1. 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa
    2. 按学号后三位下载不同年份月份的数据(例如201506110187号同学,就下载2018年以7开头的数据,看具体数据情况稍有变通)
    3. 解压数据集,并保存在文本文件中                                                            
    4. 对气象数据格式进行解析                                                                     
    5. 编写map函数,reduce函数                                                                                                                                                                                                                                                                                                     
    6. 将其权限作出相应修改                                                                              
    7. 本机上测试运行代码                                                                                         
    8. 放到HDFS上运行
      1. 将之前爬取的文本文件上传到hdfs上                                                                                
      2. 用Hadoop Streaming命令提交任务                                                                                                                           

    9. 查看运行结果                                                                                                                                                                                                                                                    最低气温                                                                   
  • 相关阅读:
    IE 8兼容:<meta http-equiv="X-UA-Compatible" content="IE=edge" /> X-UA-Compatible的解释
    点击下载,下载图片
    修改输入框placeholder文字默认颜色-webkit-input-placeholder
    rest_framework目录
    Django目录
    python基础内容目录
    hadoop伪分布式搭建
    通过ldap验证svn服务
    LDAP目录服务
    Python基础之字符串拼接简单介绍
  • 原文地址:https://www.cnblogs.com/stcy520/p/9016234.html
Copyright © 2020-2023  润新知