交替方向乘子法（ADMM）

交替方向乘子法（ADMM）

交替方向乘子法（ADMM）

详细请看：交替方向乘子法（Alternating Direction Method of Multipliers） - 凯鲁嘎吉 - 博客园

参考1

参考2

经典的ADMM算法适用于求解如下2-block的凸优化问题（ $p^*$ 是最优值，令 $x^*,z^*$ 表示一组最优解）：

$egin{align} p^* = min ~ & f(x)+g(z)\ ext{s.t. } & Ax+Bz=c. end{align}$

Block指我们可以将决策域分块，分成两组变量， $xin mathbb{R}^n,zin mathbb{R}^m.$ 这里面 $Ain mathbb{R}^{p imes n},Bin mathbb{R}^{p imes m},cin mathbb{R}^p.$ $f:mathbb{R}^n ightarrow mathbb{R},g:mathbb{R}^m ightarrow mathbb{R}$ 都是凸的。分成2-block是因为3-block及以上的问题性质会差一点，分析起来不太好说清楚（虽然实际当中基本上几个block都可以用，一般都会收敛...）。

那么我们这里就可以写出这个凸优化问题的增广拉格朗日函数（augmented Lagrangian function）：

$L_{ ho}(x,z,y)=f(x)+g(z)+y^T(Ax+Bz-c)+( ho/2)|Ax+Bz-c|_2^2.$

注意到这个增广的意思就是在原来的拉格朗日函数后面加了个平方的正则项（系数 $ho/2$ ），这个主要是为了不需要 $f$ 一定要是严格凸（strictly convex）/值域有限（只要是一般的凸函数就行了）然后也能保证收敛性。然后我们对 $L_ ho$ 用dual ascent（对偶上升法），或者也就是拉格朗日乘子法就知道可以有这样一个算法形式：

$egin{align} (x^{k+1},z^{k+1}):=~ & argmin_{x,z} L_{ ho}(x,z,y^k)\ y^{k+1}:= ~ & y^k+ ho(Ax^{k+1}+Bz^{k+1}-c). end{align}$

其实dual ascent原理非常简单，本质上来说就是primal variable迭代方向取拉格朗日函数对primal variable的次微分，dual variable迭代方向取拉格朗日函数对dual variable的次微分（这里的话就是 $frac{partial L_{ ho}}{partial y}$ ）。这也是所谓拉格朗日乘子法的一般思路（method of multipliers）。当然这边还有一些细节，比如对偶变量迭代步长选了 $ho$ 。所以如果你想从基础打起的话，可以从比如S. Boyd and L. Vandenberghe的凸优化书第五章看起。

那么ADMM，也就是所谓“交替方向”的乘子法就是在原基础上（ $x,z$ 一起迭代）改成 $x,z$ 单独交替迭代（如果有更多block也是类似）。即，我们的ADMM算法为

$egin{align} x^{k+1}:=~ & argmin_{x} L_{ ho}(x,z^k,y^k)\ z^{k+1}:=~ & argmin_{z} L_{ ho}(x^{k+1},z,y^k)\ y^{k+1}:= ~ & y^k+ ho(Ax^{k+1}+Bz^{k+1}-c). end{align}$

本节最后，我们指出ADMM算法形式的另一种等价形式。如果定义所谓的残差（residual）为 $r^k:=Ax^k+Bz^k-c$ ，那么注意到再定义 $u^k:=(1/ ho)y^k$ 作为所谓scaled dual variable，我们有 $(y^k)^Tr^k+( ho/2)|r^k|_2^2=( ho/2)|r^k+u^k|_2^2-( ho/2)|u^k|_2^2.$ 即我们可以改写ADMM算法形式为

$egin{align} x^{k+1}:=~ & argmin_{x} left{ f(x)+( ho/2)|Ax+Bz^k-c+u^k|_2^2 ight}\ z^{k+1}:=~ & argmin_{z} left{ g(z)+( ho/2)|Ax^{k+1}+Bz-c+u^k|_2^2 ight}\ u^{k+1}:= ~ & u^k+Ax^{k+1}+Bz^{k+1}-c. end{align}$

嗯这个形式就比前面那个更简洁些，我们一般叫前一种形式为ADMM的unscaled形式，而这种就自然是scaled形式了。很多ADMM分析都是基于这个scaled形式的。

参考文献

ADMM ：http://web.stanford.edu/~boyd/admm.html

许浩锋. 基于交替方向乘子法的分布式在线学习算法[D]. 中国科学技术大学, 2015.

覃含章：https://www.zhihu.com/question/309568920/answer/580226096
用ADMM实现统计学习问题的分布式计算 · MullOver ：http://shijun.wang/2016/01/19/admm-for-distributed-statistical-learning/

《凸优化》中文版PDF+英文版PDF+习题题解：https://pan.baidu.com/s/1oRGp4_LfDVLo86r79pnXvg
相关阅读:
Android开发学习总结(一)——搭建最新版本的Android开发环境
 数据库服务器编码，数据库编码，数据库表编码，数据库表字段编码
 webservice(二)简单实例
 webservice(一) 概念
 JAVA的StringBuffer类
 Log4J日志配置详解
 如何配置使用 Log4j
使用MyBatis Generator自动创建代码
 Spring MVC POST中文乱码解决方案
 JSP开发中对jstl的引用方式(标签库引用）
原文地址：https://www.cnblogs.com/kailugaji/p/10433774.html

交替方向乘子法（ADMM）

交替方向乘子法（ADMM）

参考1

参考2

参考文献