• 主成分分析法(PCA)答疑


    问:为什么要去均值?

    1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。
    2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX',若没有减去均值,则XX‘后面还要减去一些东西(还不明白可以参考多元统计分析的书)。除以标准差是为了统一并消除量纲。一个矩阵中有多个向量,有些可能表示了长度,有些表示了重量,除以标准差,才能让它们仅以“数”的概念一起比较运算。
    3、标准化的做法。举例,若你的矩阵A是5行3列,第一列表示长度,第二列表示时间,第三列表示质量,那么矩阵A等同于对这个三个量进行了5次测量,所以5*3.这样3个分量有各自的均值和标准差,对这个矩阵中15个元素均做标准化只要减去长度、时间、质量各自的均值并除以标准差即可。

    4、图像不需要除以标准差,因为他们都是像素值,同量纲同尺度。只减均值就行。

  • 相关阅读:
    结合人工智能的高性能医学:现状、挑战与未来
    2019年人工智能行业25大趋势
    睡眠分期--深度学习算法
    并行技术
    元数据--你有没有注意?
    战略、策略与执行
    机器学习前沿03
    元学习--learn to learn
    机器学习前沿02
    机器学习玩法
  • 原文地址:https://www.cnblogs.com/yyxayz/p/4150170.html
Copyright © 2020-2023  润新知