• [模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取


    1,引言

    有关模式识别的一个主要问题是维数灾难。我们将在第7章看到维数非常easy变得非常大。

        减少维数的必要性有几方面的原因。计算复杂度是一个方面。还有一个有关分类器的泛化性能。

        因此,本章的主要任务是:在尽可能保留特征的分类判别信息前提下,来选择重要的和维数少的特征量。这个过程被称作特征选择或者特征降维。

        定量描写叙述来讲,选择的特征应该使得类内距离减小,类间距离增大。

        一些文献表述中使用feature extraction,而不是我们本文使用的featureselection。这将会和第7章的一些描写叙述有些冲突。

        2。预处理

    ① 离群值删除(outlier removal)

    离群值定义为偏离相关变量均值较大的点

    ② 数据归一化

    很多特征值位于不同的动态阈中。而大的特征值对损耗函数会有较大影响。所以归一化到相似阈值会有帮助。

    ③ 缺失数据

    一些特征会从特征量量中缺失。比如遥感在特定区域被其它传感器覆盖的情况就是如此。

    3。峰值现象

    4,基于统计如果的特征选取

    5,接收操作(THE RECEIVER OPERATING)特性曲线

    6。类可分性度量

    7。特征子集选取

    8,最优特征代(OPTIMAL FEATURE GENERATION)

    9。神经网络和特征选取

    10,一个提示泛化理论

    11。贝叶斯信息标准

  • 相关阅读:
    mysql常用基本命令
    mysql8.0.13下载与安装图文教程
    k8s ingress 增加跨域配置
    Jenkins 备份恢复插件 thinBackup 使用
    k8s HA master 节点宕机修复
    nginx 跨域问题解决
    mongodb 3.4.24 主从复制
    k8s 线上安装 jenkins并结合 jenkinsfile 实现 helm 自动化部署
    k8s helm 运用与自建helm仓库chartmuseum
    centos6 源码安装 unzip
  • 原文地址:https://www.cnblogs.com/yfceshi/p/6738756.html
Copyright © 2020-2023  润新知