1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
在user/hadoop创建文件夹EnglishWord
上传文档到user/hadoop/EnglishWord文件夹中
在hive创建表world
导入文本world并查看
.
用SQL进行词频统计并保持到表word_count
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
在user/hadoop创建文件夹EnglishWord
上传文档到user/hadoop/EnglishWord文件夹中
在hive创建表world
导入文本world并查看
.
用SQL进行词频统计并保持到表word_count