• 机器学习(分类器)


    • 构造分类器的主要步骤:

      一,数据的划分:训练数据和测试数据

    1. 保持的方法:三分之二的数据做训练集,另外三分之一的数据做测试集。在测试集上的分类精度作为最终的分类精度
    2. k折交叉验证方法:将数据集随机分成大致相当的k份,s1,s2,s3,s4…….sk,训练和测试重复进行k次。在第i次的测试中ki做为测试集,其它的作为训练集,最终分类器的分类精度取k次测试分类精度的平均值,这种方法适用于原始数据量较小的情况,这时候不适合直接应用保持的方法。

    二,构造分类器算法对训练集进行学习,得到一个分类模型,最终它可以是分类规则,决策树或数学公式等形式、

    三,使用分类模型对测试集进行检验,如果测试的结果符合要求(分类精度,召回率)进行第四步,否则,进行第二步

    四,使用得到的分类器对未知类别的数据进行分类。

    五,准确度分析:一般采用召回率和精准率,一个好的分类器同时具有较高的召回率和精准率。

    QQ截图20151113125303

    注意:Relevant 和Retrieved的大小不可相差太大。

     

    六,召回率和精准率综合考虑,评价指标F1公式如下:

    360截图-12793626

  • 相关阅读:
    ngx_lua_waf完整安装说明
    Linux(CentOS)下的JDK的安装和环境配置
    Genymotion的2个问题及解决方法
    Appscan的第一个测试请求就是提交MAC地址
    oracle相关知识
    数据结构之树
    kafka的写入内存?硬盘
    算法的时间复杂度和空间复杂度
    Java线程池
    mapReduce和spark的shuffle
  • 原文地址:https://www.cnblogs.com/dmir/p/4961830.html
Copyright © 2020-2023  润新知