MapReduce编程之实例分析：wordCount - 润新知

MapReduce编程之实例分析：wordCount

1.WordCount程序任务

　　输入:一个包含大量单词的文本文件

　　输出:文件中没个单词及出现的次数(频数)，并按照单词顺序排序每个单词和其频数占一行，单词和频数之间有间隔

2.WordCount程序设计思路

　　WordCount可以使用MapReduce去做

　　在/usr/local/目录下创建WordCount文件夹

　　mkdir /usr/local/wordcount

　　切换到指定文件夹，创建文件

　　vim file1.txt vim file2.txt

　　在Hdfs中创建一个input文件夹

　　把刚才创建的两个文件上传到input里

　　hadoop fs -put *.txt /input

　　运用wordcount程序

　　在hadoop的jar文件中默认已帮助我们提供了wordcount程序，都位于/usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce下

　　#切换目录

　　cd /usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce

　　#运行jar包程序

　　hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /input/ /putout/

　　#查看运行结果

　　hadoop fs -cat /putout/part-r-00000
相关阅读:
SignalR + MVC5 简单示例
 SignalR 简单示例
 Web API 简单示例
 Windows Azure 使用体验
 SQL Server 2014 安装小记
 SSRS 迁移
 SSH配置（同一服务器不同用户）
【6】Zookeeper脚本及API
【3】Kafka安装及部署
 【2】Kafka概念及原理
原文地址：https://www.cnblogs.com/ws1149939228/p/12884281.html

Copyright © 2020-2023 润新知