启动hadoop
Hdfs上创建文件夹
创建的文件夹是datainput
上传文件至hdfs
启动Hive
创建原始文档表
导入文件内容到表docs并查看
用HQL进行词频统计,结果放在表word_count里
查看统计结果