转：[大数据竞赛]算法讨论

1，首先使用基于item的协同过滤推荐。
2，然后得出每个用户推荐的得分。
3，得分>3分的就当成这个用户的推荐Item

然后专门计算7月15日-8月15日之间的用户点击行为，把查看、收藏、购物车这3种行为收集起来，如果这3种行为次数较多，那么用户在9月份购买此产品的可能性会很大。

已测

F1 < 0.5%

原因：用户少，商品多

上周没用任何算法，单纯把关联数据全部关联起来，f1-score=2.3% p>r
感觉上来直接用协同过滤不好，关键是topN，这个N怎么取，取好了效果应该也不错吧？
还感觉购物车和收藏可能是大部分噪音的来源，lz要是单纯相加计算的话，不太好吧？

阿里内部人士说用LR+协同过滤，当时就蒙了。。。
现在想，是不是可以用LR预测某用户下个月是否会买？这个要是能确定F1会不会上升一个档次呢？可惜特征值没建立好啊，完全没效果
继续讨论啊

相关阅读:
Kubernetes的RBAC是啥
《高效学习的七个习惯》总结
Kubernetes的CronJob对象
Kubernetes的Job对象
什么是DaemonSet
Docker容器日志路径
什么是StatefulSet
Kubernetes的Deployment对象使用
MXNET：卷积神经网络基础
MXNET：深度学习计算-GPU

原文地址：https://www.cnblogs.com/DjangoBlog/p/3640309.html