网站用户行为分析
- 步骤
1.1 本地数据集上传到数据仓库Hive
- 数据集下载与查看
- 数据集预处理
- 把数据集导入HDFS中
- 在Hive上创建数据库
1.2 Hive数据分析
- 给出数据分析需求
- 用select语句实现数据分析
- 数据分析结果查看与保存
1.3 Hive、MySQL、HBase数据互导
- Hive数据分析结果(如用户购买与浏览比例),从Hive传输到MySQL中。
- Hive数据分析结果(如用户购买与浏览比例),从MySQL传输到Hbase中。
- 参照博客步骤,依次将user_action传入Hive、MySQL、HBase中。
http://dblab.xmu.edu.cn/blog/1059-2/
(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录
分析步骤
- 语句:select count(*) from bigdata_user where visit_date >'2014-12-10' and visit_date <'2014-12-13' and behavior_type='4' limit 10;
- 结果截图:运行或存为表格后的查询显示
(2)用户行为分析需求:分析每月1-31号购买情况
- 语句:代码:select count(distinct uid),month(visit_date) from bigdata_user where behavior_type='4' group by month(visit_date) limit 10;
- 结果截图:运行或存为表格后的查询
(3)按某一特殊日期(如双12)进行用户行为分析
- 各省份购买商品数量
- 商品购买与浏览比例
- 用户活跃度分析
- 购买5件以上商品的用户
(4)用户购买与浏览比例。
1.计算拥护购买数与浏览数的比值。
2.创建表格保存结果