图像处理与计算机视觉的论文创新点总结

图像处理与计算机视觉的论文创新点总结
- 创新点的一般方向：
  - ⇒ Generalized：泛化
  - fixed ⇒ Adaptive，自适应（自调节）
    
    local adaptive
  - hard ⇒ soft（threshold）
  - single ⇒ local，individual ⇒ others；
  - ⇒ Marginalized，⇒ Modified：修正的
  - straightforward ⇒ iteration，直接求解，迭代求解；
  - linear ⇒ non-linear，线性 ⇒ 非线性；
- 做距离度量（或者其他运算）时，仅考虑两个样本，而不考虑同一样本空间的其他样本
  - 在做两个样本的距离度量（或者其他运算），不仅考虑此两个样本，还综合考虑同一样本空间的其他全部样本（显然样本之间存在 relation，相关性），使用 K-NN 算法选出距离最近的样本，比如著名的马氏距离；
1. Dictionary Learning（字典学习）

字典学习是图像的稀疏表示（sparse representation）的重要处理方法。K-SVD 字典学习又是字典学习理论的核心模型。

给定如下参数：
- X=[x1,x2,…,xN]，样本集；
- D=[d1,d2,…,dm]，过完备字典；
- A=[α1,α2,…,αN]，学习到的 sparse decomposition coefficients
传统的字典学习目标函数如下：

minD,α∑i∥xi−Dαi∥2+λ∑i∥αi∥2

改进的思路：增加约束（正则化项）：
- 保角约束（angle-preserving，conformal）：
  
  $min D, α \sum i ∥ x i - D α i ∥ 2 + λ 1 \sum i ∥ α i ∥ 2 + λ 2 f (α)$
  
  如何定义这里的 f(α) 呢。字典学习的过程就是 zi=g(xi)，X空间向Z 空间的映射过程，我们首先找到通过 K-NN 的方法在样本空间（sample set）中寻找离当前样本 xi 最近的两个样本 xj 和 xk，其对应的 Z 空间中的元素为 zi,zj,zk，保角特性要求
  
  $∥ x i - x j ∥ 2 ∥ z i - z j ∥ 2 = ∥ x i - x k ∥ 2 ∥ z i - z k ∥ 2 = ∥ x k - x j ∥ 2 ∥ z k - z j ∥ 2 = s i$
  进一步转化为：
  
  $\sum j, k \in N (∥ x j - x k ∥ 2 - s i ∥ z j - z k ∥ 2) 2$
  
  则 f(αi) 的形式为：
  
  $f (α i) = \sum j, k \in N (∥ x j - x k ∥ 2 - s i ∥ α j - α k ∥ 2) 2$
- A 的低秩（low-rank）约束：
  
  $min D, α \sum i ∥ x i - D α i ∥ 2 + λ 1 \sum i ∥ α i ∥ 2 + λ 2 f (α) + λ 3 ∥ A ∥ ⋆$
参见论文：Conformal and Low-Rank Sparse Representation for Image Restoration.

2. 软硬阈值
- 硬阈值函数：
dj,k^={dj,k,|dj,k|≥λ0,otherwise
- 软阈值函数：
  
  $d j, k^= ⎧ ⎩ ⎨ ⎪ ⎪ d j, k - λ, d j, k \geq λ 0, otherwise d j, k + λ, d j, k \leq - λ$
  
  当然也可转换为一个更为简洁的写法：
  
  $dj,k^={sign(dj,k)(|dj,k|−λ),|dj,k|≥λ0,otherwise$
改进的思路：继续对阈值函数进行调整：
- 简单的线性叠加（linear）：αf1+(1−α)f2
- 非线性的构造方法（nonlinear，使其具有更快或者更为舒缓的衰减函数，当然选择指数函数：ex）
相关阅读:
【转】详解 ASP.NET异步
 [转]C# Unity使用
 [转载]C# 温故而知新：Stream篇
 [转]SQL Server 2008带字段注释导入Power Designer 9.5
SOAOffice控件
 【转】javascript 杂谈之哪种写法你更喜欢？
【转】提搞网站访问速度的可做哪些优化
 用vs.NET创建Windows服务
 利用IIS的404错误将文件重写成目录的简单方法
 【转】寻找成为开发高手的密匙
原文地址：https://www.cnblogs.com/mtcnn/p/9423414.html

图像处理与计算机视觉的论文创新点总结

1. Dictionary Learning（字典学习）

2. 软硬阈值