一、明确分析目的
1、 最受欢迎的三种产品;
通过分析受欢迎的产品类别,将此作为重点营销产品。
2、 各种产品的年龄段分布情况;
通过对各个年龄段的客户群体进行分析,据此了解顾客喜好,有针对性的进行营销。
3、 复购率情况(判定标准:本次分析将有推荐的数据认为是可复购的);
复购率可以反映出用户体验的好坏,针对复购率低的需要找出原因,并针对具体原因找到解决方案。
二、数据集描述
数据集名称:Women's E-Commerce Clothing Reviews
数据集来源:https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews
数据集量:23486*10
列名称理解:
Id:编号
Clothing ID:产品唯一ID
Age:用户年龄
Title:评论标题
Review Text:评论内容
Rating:评分
Recommended IND:是否推荐
Positive Feedback Count:正反馈计数
Division Name:产品码数(小码、均码、大码)
Department Name:产品大类别
Class Name:产品类别名称
三、数据清洗
提取有效字段(跟分析目的有关的字段);
剔除产品名称为空的值;
重复值处理:无重复值;
四、数据分析
4.1、最受欢迎的三种产品
衡量指标:销售数量、评分、推荐次数;
通过数据透视表对各类产品进行汇总并排序得到如下信息:
由此可以看出:最受欢迎的三种产品分别是Dresses、Knits、Blouses,应该作为重点营销,同时可以看出,产品Casual bottoms基本上已经滞销了,不需要讲成本在该产品上投入太多。
4.2、各种产品的年龄段分布情况
为考虑年龄段分布情况,添加了辅助列Age Distribution,如下所示:
通过数据透视表进行分组统计:
很明显,35-60岁中年消费群体最多,其次是青年客户群体,由此可见,电商的主要客户群体是中青年女性,应该主要开发中青年女性服装。
4.3、复购率情况
从上表可以发现一个很明显的现象,所有产品复购率相对来说还是比较高的,说明整体用户体验比较好,当然考虑复购率的前提是销量,对于购买人数少的产品,即使复购率高也不应该投入过多的成本;对于销量高的产品的复购率,还有继续优化的空间。
五、结论及建议
通过分析可以看出,最受欢迎的三种产品分别是Dresses、Knits、Blouses,应该作为重点营销,对于销量较低的产品可以适当采取促销等活动吸引更多的顾客。
该电商的主要客户群体是中青年女性,应该重点开发中青年女性服装。
通过复购率分析可以看出该电商产品的整体用户体验较好,可以在产品推广方面做一些优化,保证好的用户体验的前提下增加销量。