• 图像处理与计算机视觉的论文创新点总结


    • 创新点的一般方向:
      • ⇒ Generalized:泛化
      • fixed ⇒ Adaptive,自适应(自调节)
        • local adaptive
      • hard ⇒ soft(threshold)
      • single ⇒ local,individual ⇒ others;
      • ⇒ Marginalized,⇒ Modified:修正的
      • straightforward ⇒ iteration,直接求解,迭代求解;
      • linear ⇒ non-linear,线性 ⇒ 非线性;
    • 做距离度量(或者其他运算)时,仅考虑两个样本,而不考虑同一样本空间的其他样本
      • 在做两个样本的距离度量(或者其他运算),不仅考虑此两个样本,还综合考虑同一样本空间的其他全部样本(显然样本之间存在 relation,相关性),使用 K-NN 算法选出距离最近的样本,比如著名的马氏距离

    1. Dictionary Learning(字典学习)

    字典学习是图像的稀疏表示(sparse representation)的重要处理方法。K-SVD 字典学习又是字典学习理论的核心模型。

    给定如下参数:

    • X=[x1,x2,,xN],样本集;
    • D=[d1,d2,,dm],过完备字典;
    • A=[α1,α2,,αN],学习到的 sparse decomposition coefficients

    传统的字典学习目标函数如下:

    minD,αixiDαi2+λiαi2

    改进的思路:增加约束(正则化项):

    • 保角约束(angle-preserving,conformal)

      minD,αixiDαi2+λ1iαi2+λ2f(α)

      如何定义这里的 f(α) 呢。字典学习的过程就是 zi=g(xi)X空间向Z 空间的映射过程,我们首先找到通过 K-NN 的方法在样本空间(sample set)中寻找离当前样本 xi 最近的两个样本 xjxk,其对应的 Z 空间中的元素为 zi,zj,zk,保角特性要求

      xixj2zizj2=xixk2zizk2=xkxj2zkzj2=si

      进一步转化为:

      j,kN(xjxk2sizjzk2)2

      f(αi) 的形式为:

      f(αi)=j,kN(xjxk2siαjαk2)2

    • A 的低秩(low-rank)约束

      minD,αixiDαi2+λ1iαi2+λ2f(α)+λ3A

    参见论文:Conformal and Low-Rank Sparse Representation for Image Restoration.

    2. 软硬阈值

    • 硬阈值函数:

    dj,k^={dj,k,|dj,k|λ0,otherwise

    • 软阈值函数:

      dj,k^=dj,kλ,dj,kλ0,otherwisedj,k+λ,dj,kλ

      当然也可转换为一个更为简洁的写法:

      dj,k^={sign(dj,k)(|dj,k|λ),|dj,k|λ0,otherwise

    改进的思路:继续对阈值函数进行调整

    • 简单的线性叠加(linear):αf1+(1α)f2
    • 非线性的构造方法(nonlinear,使其具有更快或者更为舒缓的衰减函数,当然选择指数函数:ex


      这里写图片描述

  • 相关阅读:
    【转】详解 ASP.NET异步
    [转]C# Unity使用
    [转载]C# 温故而知新:Stream篇
    [转]SQL Server 2008带字段注释导入Power Designer 9.5
    SOAOffice控件
    【转】javascript 杂谈之哪种写法你更喜欢?
    【转】提搞网站访问速度的可做哪些优化
    用vs.NET创建Windows服务
    利用IIS的404错误将文件重写成目录的简单方法
    【转】寻找成为开发高手的密匙
  • 原文地址:https://www.cnblogs.com/mtcnn/p/9423414.html
Copyright © 2020-2023  润新知