Hadoop综合大作业总评

Hadoop综合大作业总评

作业来源：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363

1、把python爬取的数据传到linux

2、把数据的逗号代替为转义字符

3、启动hadoop集群

4、启动hive

5、创建数据库

6、创建表并把hdfs的数据导入表中

7、统计数据一共有1124条

8、列出前20名观众分数和时间

9、列出前20名观众的评论

10、统计评论分数大于4分（总5分）的评论条数，大部分是大于4分，说明

《千与千寻》的好评率很高。

11、列出各城市的评论数

12、统计北京的评论数

13、统计上海的评论数

14、统计广州的评论数

15、统计深圳的评论数

、、、、、

本作业来自于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310

利用Shell命令与HDFS进行交

1.目录操作：

（1）、在HDFS中为hadoop用户创建一个用户目录（hadoop用户）：

（2）、在用户目录下创建一个input目录

（3）、在HDFS的根目录下创建一个名称为input的目录

（4）、删除HDFS根目录中的“input”目录：

2.文件操作：
相关阅读:
基于FPGA的均值滤波算法实现
 QuartusII 13.0 PLL IP Core调用及仿真
 varnish-4.x VCL之grace mode
varnish-4.x VCL之cookie及缓存时间
 varnish-4.x VCL之强制cache miss
Mariadb-Galera10二进制包安装
 MariaDB Replication
MariaDB 使用CONNECT存储引擎
 MariaDB 使用TokuDB存储引擎
 Ubuntu启用VNC服务的配置
原文地址：https://www.cnblogs.com/gzcchyf/p/11058802.html

Hadoop综合大作业总评

本作业来自于：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310

利用Shell命令与HDFS进行交

1.目录操作：

（1）、在HDFS中为hadoop用户创建一个用户目录（hadoop用户）：

（2）、在用户目录下创建一个input目录

（3）、在HDFS的根目录下创建一个名称为input的目录

（4）、删除HDFS根目录中的“input”目录：

2.文件操作：