• Weka Explorer(探索者界面) 详解(2)


    关联规则标签 Associator

    关联标签页的界面就更简单了,算法也少,其中最有名的算法就是Apriori算法。可以通过点击算法的选择框来配置Apriori算法查找的规则的 最小支持度和最小置信度。查找的规则如下形式:

    1. outlook=overcast 4 ==> play=yes 4    conf:(1)

    第一个数字4表示符合条件的实例数目,第二个数字4表示对应的关联规则也为真的数目,4÷4=1,所以上面这条规则的置信度为1即 conf:(1)。


    属性选择标签  Select Attributes

    很多时候我们获取的样本中并不是每个属性都对分类或预测起作用。比如预测机票的价格,航程、舱位和季节都是很重要的属性,而机票的经销商是谁则对价格的影响很小。为了避免我们的算法被无关的属性影响,找出对结果影响最大的属性而过滤掉对结果没影响的属性是很必要的。属性选择标签就是用来挑选出那些重要属性的。其中最著名的算法当属1R算法了。1R算法根据单个属性的规则进行预测,使误差值最小,并且根据误差值排序。

    视图标签 Visualize

    Visualize面板可以帮助用户可视化一个数据集,它显示的是每对属性的一个二维散点图,可以放大显示。
  • 相关阅读:
    [CentOS7] 常用工具 之 差异备份工具 rdiff-backup
    [CentOS7] 常用工具 之 防暴力破解工具 Fail2ban
    [CentOS7] 增加yum源
    [CentOS7] firewalld重启失败 Failed to start firewalld
    常见性能优化
    Acunetix 11 配置详解
    linux 环境安装及学习
    linux 个人配置记录
    linux 配置阿里云yum库
    阿里云 oss实时日志查询
  • 原文地址:https://www.cnblogs.com/rav009/p/5131127.html
Copyright © 2020-2023  润新知