• 图像,矩阵以及鲁棒性笔记


    1.黑白图像不是二维数据。图像的维度,实际上是图像中特征向量的数量。用向量数据化图像,想象按行扫描,遇到的每一个像素都是向量的一个元素,像素个数就是向量维数;例如二维图像矩阵表示为:256*256=65536,维数还是很高的。一个100x100像素的图像其灰度图产生的特征向量是10000维度,而1920x1080像素的图像则对应2073600维度的特征向量。

    2.图像降维:降维算法中的”降维“,指的是降低特征矩阵中特征的数量。

    假设一个矩阵 [公式] (大小为 [公式] ,已经归一化), 那么可以得到一个 [公式] 的协方差矩阵 [公式] 。这是一个对称矩阵,特征向量正交。

     

    因此应用SVD分解 [公式] 。其中 [公式] 是特征向量组成的矩阵( [公式] ), [公式] 是由特征值组成的对角矩阵。特征向量对应数据的主要方向。然后就是把数据投影到这个方向上来。那么投影后为 [公式]

    如果只取前 [公式] 个特征值对应的特征向量,那么原本 [公式] ( [公式] )可以变成 [公式] ( [公式] ),完成了降维。

     

    2.假设我们要执行面部识别,即基于带有标记的面部图像训练数据集来确定人的身份。一个办法是把图像上每个像素的亮度作为特征。如果输入图像的大小是32×32,这意味着该特征向量包含1024个特征值。判断新的图像通过计算这1024维矢量与我们训练数据集中特征向量之间的欧氏距离完成。然后最小距离告诉我们正在寻找的那个人。

    因为2D数据的特征向量是2维的,三维数据的特征向量是3维的,1024维数据的特征向量是1024维。换句话说,为了可视化,我们可以重塑每个1024维特征向量到一个32×32的图像。图10展示了由剑桥人脸数据集的特征分解获得的前四个特征向量: 
    这里写图片描述

    每个1024维特征向量可以映射到N个最大的特征向量,并可以表示为这些特征脸的线性组合。这些线性组合的权重确定人的身份。因为最大特征向量表示数据中的最大方差,所以这些特征脸描述信息量最大的图像区域(眼睛,鼻子,嘴等)。只考虑前N(例如,N = 70)个特征向量,特征空间的维数大大减少了。剩下的问题是现在使用了多少个特征脸,或者在一般情况下,应保留多少个特征向量。

    特征脸提取具体步骤以及介绍:Eigenface-based facial recognition

    2.Certified Adversarial Robustness via Randomized Smoothing

       代码地址: http://github.com/locuslab/smoothing.

       定义: “smoothed” classifier g

       论文证明的结论

        从任意分类器f得到g的方法:通过大量采样。

      

    参考文献:

    1.https://www.zhihu.com/question/270867521

    2.https://www.jianshu.com/p/c1a9604db03b

    3.https://cloud.tencent.com/developer/article/1030408

    4.Jeremy M. Cohen, Elan Rosenfeld, J. Zico Kolter:Certified Adversarial Robustness via Randomized Smoothing. ICML 2019: 1310-1320

    5.https://blog.csdn.net/emmaczw/article/details/78383115

    6.https://blog.csdn.net/u010006643/article/details/46417127#

  • 相关阅读:
    java Class的 getSuperclass与getGenericSuperclass区别
    再有人问你volatile是什么,把这篇文章也发给他
    深入理解乐观锁与悲观锁
    再有人问你Java内存模型是什么,就把这篇文章发给他
    再有人问你synchronized是什么,就把这篇文章发给他
    《成神之路-基础篇》JVM——Java内存模型(已完结)
    css
    css
    require.js
    css -border
  • 原文地址:https://www.cnblogs.com/xueqiuqiu/p/12230215.html
Copyright © 2020-2023  润新知