• 无监督学习


    分类和回归都属于监督学习,特点就是他们都有一个标注,而标注的存在就是给分类任务或者回归任务一个指引,告诉算法,具备什么样特征的数据是什么样的标注,也就是它叫什么名字,哪些数据是一样的,哪些数据是不一样的,都是通过标注来区分的。

    无监督学习:没有标注,目的就是试图给这些数据加上标注,而打标注并不是随便打的,有一个原则和假设就是我们希望给没有标注的数据加上标注以后,同一个标注内的数据尽可能的相似,而不同标注内的数据应该尽可能不同。

    无监督学习用的最多的是两种算法:1.聚类,2.关联规则

     

     , 

     

     ,  问题:对异常值也很敏感,

     , 

     ,  

     置信度:购买了X的情况下购买了Y的概率(类似条件概率)

     

     提升度意义:分子:购买X的情况下购买Y的概率;分母:购买Y 的概率。在购买X的情况下购买Y的概率大于了本身Y的概率,那我们就认为购买X对购买Y有提升作用,若小于1,则认为购买X对购买Y没有起到提升作用,他们两个其实可以认为是相斥的(买了X就不买Y了)

    ,  

     用低阶频繁项集和阈值找到高阶频繁项集,直到找打最高阶的

    , 

  • 相关阅读:
    概率论
    Python3爬虫爬取淘宝商品数据
    利用Python数据分析基础
    Linux安装MATLAB2016a
    python3爬取高清壁纸(2)
    python3爬取高清壁纸(1)
    Git使用基础
    Python3基础
    正则表达式的使用基础
    Nginx配置多域名代理
  • 原文地址:https://www.cnblogs.com/wuxiping2019/p/12392262.html
Copyright © 2020-2023  润新知