• [模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取


    1,引言

    有关模式识别的一个主要问题是维数灾难。我们将在第7章看到维数非常easy变得非常大。

        减少维数的必要性有几方面的原因。计算复杂度是一个方面。还有一个有关分类器的泛化性能。

        因此,本章的主要任务是:在尽可能保留特征的分类判别信息前提下,来选择重要的和维数少的特征量。这个过程被称作特征选择或者特征降维。

        定量描写叙述来讲,选择的特征应该使得类内距离减小,类间距离增大。

        一些文献表述中使用feature extraction,而不是我们本文使用的featureselection。这将会和第7章的一些描写叙述有些冲突。

        2。预处理

    ① 离群值删除(outlier removal)

    离群值定义为偏离相关变量均值较大的点

    ② 数据归一化

    很多特征值位于不同的动态阈中。而大的特征值对损耗函数会有较大影响。所以归一化到相似阈值会有帮助。

    ③ 缺失数据

    一些特征会从特征量量中缺失。比如遥感在特定区域被其它传感器覆盖的情况就是如此。

    3。峰值现象

    4,基于统计如果的特征选取

    5,接收操作(THE RECEIVER OPERATING)特性曲线

    6。类可分性度量

    7。特征子集选取

    8,最优特征代(OPTIMAL FEATURE GENERATION)

    9。神经网络和特征选取

    10,一个提示泛化理论

    11。贝叶斯信息标准

  • 相关阅读:
    2.13 day 10
    2.12 day9
    Mongo基础知识
    给mongodb设置密码
    前端框架
    SecureCRT的一些设置
    node 服务器框架
    python 知识博客
    数据库记录
    有用的网站
  • 原文地址:https://www.cnblogs.com/yfceshi/p/6738756.html
Copyright © 2020-2023  润新知