天猫评论的差评和好评的数据分析
评论的数据是用爬虫爬的,在这里不说了,很多教程都详细的介绍了。
实现思路,我的评判标准是:
好 | 较好 | 差 | 较差 |
---|---|---|---|
赞 | 喜欢 | 垃圾 | 慢 |
非常好 | 不错 | 坑 | 退 |
非常喜欢 | 挺好 | 无语 | 不值 |
好评 | 美 | 太差 | 将就 |
超级好 | 棒 | 严重 | 失望 |
非常满意 | 实用 | 很差 | 根本 |
特别好 | 很好 | 差评 | 算了 |
惊喜 | 不满意 |
把这些关键词直接使用IF/FIND/ROUNDUP函数结合使用找出来内容中包含的关键字,运用excel在做透视表,汇总起来数据,算出差评率
根据上面的数据,可以用EXCEL中的FIND函数找到评价内容中是否有这个字,如果有对应相对的评价
=ROUNDUP(IFEROR(FIND(K$1,$C2)/1000,0),0)
EXCEL中的$代表锁定,K$1,代表的锁定第一行,$C代表的是锁定C这一列,FIND函数如果找到就返回索引位置,找不到就返回0,ROUNDUP函数是向上取整,例如3.2取为4,0.03取为1。
因为人的情感里面有可能前半句是好话,但是陡然一转就进行了缺点的批评,故要算出每一个词出现的评分,最后加起来进行统计,正的话是好评,负的话是差评
=IF(AK2>0,"差",IF(S2>0,"好",S2+AB2-AK2-AV2))
最后统计出结果:
=IF(AY2="差","差评",IF(AY2<0,"差评","好评"))
统计出评价字数:
=IF(LEN(C2)>90,"90字以上",IF(LEN(C2)<50,"50字以下","50字以上"))
之后再进行透视表的汇总和透视图的绘画,算出差评率和好评率,以及累积差评率,就不详细说了。