• 转:[大数据竞赛]算法讨论



    1,首先使用基于item的协同过滤推荐。
    2,然后得出每个用户推荐的得分。
    3,得分>3分的就当成这个用户的推荐Item

    然后专门计算7月15日-8月15日之间的用户点击行为,把查看、收藏、购物车这3种行为收集起来,如果这3种行为次数较多,那么用户在9月份购买此产品的可能性会很大。

    已测

    F1 < 0.5%

    原因:用户少,商品多

    上周没用任何算法,单纯把关联数据全部关联起来,f1-score=2.3% p>r
    感觉上来直接用协同过滤不好,关键是topN,这个N怎么取,取好了效果应该也不错吧?
    还感觉购物车和收藏可能是大部分噪音的来源,lz要是单纯相加计算的话,不太好吧?

    阿里内部人士说用LR+协同过滤,当时就蒙了。。。
    现在想,是不是可以用LR预测某用户下个月是否会买?这个要是能确定F1会不会上升一个档次呢? 可惜特征值没建立好啊,完全没效果
    继续讨论啊

  • 相关阅读:
    Kubernetes的RBAC是啥
    《高效学习的七个习惯》总结
    Kubernetes的CronJob对象
    Kubernetes的Job对象
    什么是DaemonSet
    Docker容器日志路径
    什么是StatefulSet
    Kubernetes的Deployment对象使用
    MXNET:卷积神经网络基础
    MXNET:深度学习计算-GPU
  • 原文地址:https://www.cnblogs.com/DjangoBlog/p/3640309.html
Copyright © 2020-2023  润新知