• 2013-6 阿里技术沙龙:标签生成与推荐系统


    倪江峰 伯隅@阿里的分享:标签、推荐、导购

    0.27%的关键字占50%PV,以标签作为中间环节

    标签为四种:品牌,品类,描述,属性

    标签数据库:标题、结构化数据、详情

    产品词挖掘:CRF模型

    商品结构化属性:半开放式结构

    描述词整理:LDA模型

    不同类型的词之间的关系挖掘

    机器标签---场景导购

    标签市场化----买卖双方的标签消费

    标签个性化

    结合可视化做场景发现

    目前这个标签系统仅做导购入口,与检索搜索无关----主要给商品更多的流量入口渠道

    ------------------------------------------

    杨宇航@百度:推荐技术在UGC产品中的应用

    领域业务主体可以考虑本体模型方式建模

    豆瓣曾工程师的分享:NIP与豆瓣标签

    标签是一种有意义的片段

    用简化的方式描述对象

    标签预测,用户画像,标签推荐

    标签的提取

    内部领域词库,使用n-gram生成候选词

    词的内部独立性与外部独立性

    词性标准---标签选择,词频特征

    TF/IDF,TextRank,基于图的排序算法

    主题模型:精度高但费时

    DNN:WordZrec工具包

    标签树有助于扩类别的推荐

    Latent Factor:隐次特征

  • 相关阅读:
    类的加载机制与反射 笔记
    json
    人人都是产品经理 笔记
    java IO
    jcrop+jquery+javaweb 实现头像裁剪、上传
    C++学习-3
    C++学习-2
    C++学习-1
    Django高级部分
    Django---模板
  • 原文地址:https://www.cnblogs.com/dhcn/p/7120668.html
Copyright © 2020-2023  润新知