• 频繁项集------->产生强关联规则的过程


    频繁项集------->产生强关联规则的过程

    1.由Apriori算法(当然别的也可以)产生频繁项集

    2.根据选定的频繁项集,找到它所有的非空子集

    3.强关联规则需要满足最小支持度和最小置性度   (假设关联规则是:A=>B  , support(A=>B)=  { P(AUB) }     confidence(A=>B)=P(B|A)={  P(AUB)/P(A)  }  。这里求概率都可以替换为求支持度计数(就是统计在源数据表中各个出现的次数,例如:P(AUB) 就找A和B在源数据表中同时发生了多少次)

    4.找到所有可能性的关联规则。例如:频繁项集为:{1,2,3} -------->非空子集则为:{1,2},{1,3},{2,3},{1},{2},{3}---------->可能的关联规则为:{1,2}=>3 , {1,3}=>2 , {1,3}=>2 , 1=>{2,3},2=>{1,3},3=>{1,2}

    5.最后计算所有可能的关联规则的置信度,找到符合最小置信度(会给出)的规则,它们则为强关联规则。

  • 相关阅读:
    day_5.25py
    day_5.24py
    day_5.22 py
    numpy模块 03
    requests 模块例题示范
    logging模块
    typing 模块
    hashlib模块和hmac模块
    random模块
    time和datetime模块
  • 原文地址:https://www.cnblogs.com/soyo/p/8202973.html
Copyright © 2020-2023  润新知