Lagrangian 对偶和 Slater 条件

Lagrangian 对偶和 Slater 条件
目录
1.Lagrange函数:

   回忆上节的记号，对于任意一个优化问题（不一定是凸优化问题）： egin{equation}egin{split} ext{min}quad & f_{0}(x) ewline ext{subject to:}quad & f_{i}(x)leq 0, i=1,...,m ewline & h_{i}(x)=0, i=1,...,pend{split}end{equation} 我们可以看到，上述问题的真正难点就在于一组等式和不等式约束条件。所谓"拉格朗日对偶"的基本想法就是通过扩充目标函数，将原有问题中的目标函数$f_{0}$扩充为$f_{0}$以及约束函数的加权和，也就是将约束函数和原始的目标函数一并统一考虑，以达到简化约束条件的目的。   这时我们可以定义其Lagrange 函数： $$L: D imesmathbb{R}^{m} imesmathbb{R}^{p} ightarrow mathbb{R},$$ egin{equation}L(x,lambda, u)=f_{0}(x)+sum_{i=1}^{m}lambda_{i}f_{i}(x)+sum_{i=1}^{p} u_{i}h_{i}(x).end{equation}
这时我们称(lambda_{i})为对应于第(i)个不等式约束条件(f_{i}leq 0)的拉格朗日乘子，称( u_{i})为对应于第(i)个等式约束条件(h_{i}= 0)的拉格朗日乘子.

2.Lagrange对偶函数和对偶问题:

  我们定义Lagrange对偶函数：

[g:mathbb{R}^{m} imesmathbb{R}^{p}longrightarrow mathbb{R}, ]
egin{equation}g(lambda, u)=inf_{xin D}L(x,lambda, u)end{equation}

值得注意的是，无论 (f_{i}), (h_{i})是否为凸函数，Lagrange 对偶函数(g)都将是凹函数。另外，对于任意的(xinmathbb{R}^{n})满足(1)中的约束条件以及((lambda, u)inmathbb{R}^{m} imesmathbb{R}^{p}),(lambdasucceq 0)
egin{split}g(lambda, u)leq L(x,lambda, u)&=f_{0}(x)+sum_{i=1}^{{m}lambda_{i}f_{i}(x)+sum_{i=1}}{p} u_{i}h_{i}(x) ewline &leq f_{0}(x),end{split}
上式两边同时取下确界"(inf_{C})"我们得到：

egin{equation}
g(lambda, u)leq p^{ast}
end{equation}

  现在我们考虑如下的优化问题：
egin{equation}egin{split}maxquad & g(lambda, u) ewline ext{subject to:}quad & lambdasucceq 0 end{split}end{equation}
则我们称该问题是原始问题(1)的"Lagrange对偶问题",简称"对偶问题"。

  这时我们设(q^{ast})为上述问题的最优值，即(q^{ast}=sup_{lbracelambdasucceq 0 brace}g(lambda, u)), 则由（4）可知(q^{ast}leq p^{ast})。我们再令(d^{ast}=p^{ast}-q^{ast}), 称(d^{ast})为原问题和对偶问题之间的差距(gap). 进一步，如果(d^{ast}=0),我们称原问题和对偶问题是强对偶的。

3.几何解释:

  为了建立一些几何直觉，我们定义集合：
egin{equation}mathcal{G} riangleqlbrace (f_{1}(x),...,f_{m}(x),h_{1}(x),...,h_{p}(x),f_{0}(x))in mathbb{R}^{{m} imesmathbb{R}}{p} imesmathbb{R}mid xin D braceend{equation}

这时候很容易知道：

egin{equation}p^{ast}=inflbrace tmid (u,v,t)in mathcal{G}, upreceq 0, v=0 braceend{equation}

对于任意的(lambdainmathbb{R}^{m}), ( uinmathbb{R}^{p}), (xin D), 过点(p riangleq (f_{1}(x),...,f_{m}(x),h_{1}(x),...,h_{p}(x),f_{0}(x)))与向量((lambda, u,1))垂直的超平面为：

[lambdacdot u+ ucdot v+t-L(x,lambda, u)=0 ]
该超平面在(t)轴上的截距正好就是Lagrange函数在((x,lambda, u))处的取值！！！

  由以上观察我们容易得出(g(lambda, u))的几何意义：

(g(lambda, u))是与((lambda, u,1))垂直且与集合(mathcal{G})相交的超平面的t-截距的最小值!!!!,

（注意，“最小值”是不严谨的说法，其实应该是下确界，但是为了方便理解而这么将错就错，毕竟这里我们是形象描述！！！）

  如上图所示，在这里我们画出了一个无等式约束条件，二维情形下对应的示意图。如图所示，(g(lambda)) 是以(-t)为斜率的一条直线在t轴上的截距。可以观察到该直线要是继续向下平移的话将不再和(mathcal{G})相交。同时我们注意到，当(lambdageq 0)时，(g(lambda)<p^{ast})，这时(gap)严格大于零，这似乎时是因为由于(mathcal{G})的非凸性并且(mathcal{G})的右半部分，也就是(ugeq 0)部分的最低点比左半部分更低造成的。

  为了研究方便，我们引入“上镜图”（Epigrah）的概念。我们定义集合：

egin{equation}mathcal{A}=lbrace p+ (u,0,t)in mathbb{R}^{{m} imesmathbb{R}}{p} imesmathbb{R}mid pin mathcal{G}, uin mathbb{R}^{m},usucceq 0, tin mathbb{R}, tgeq 0 braceend{equation}
并称之为最优化问题(1)的上镜图（Epigrah)。容易看出，上镜图是由(mathcal{G})的一系列正向平移所构成。

  如图所示，我们这里画出了和上图情形之下的上镜图(mathcal{A})的示意图。我们容易验证如下的性质：

性质1:如果原问题（1）是一个凸优化问题，也就是(f_{i}),i=0,..,m均为凸函数，而(h_{i}),i=1,...,p均为仿射函数的时候，其上镜图(mathcal{A})是一个凸集。

###4.Slater条件:
  有了以上的铺垫，我们可以介绍一个结果，它告诉我们，在什么样的条件下凸优化问题和其Lagrange对偶问题是强对偶的，也就是什么条件下我们可以将原问题进行转化。所幸的是，这个条件告诉我们，一般情况下强对偶是成立的，因为该条件很弱。
定理：如果原问题(1)是一个凸优化问题，存在( ilde{x}in ext{relint} D) 使得：(f_{i}( ilde{x})<0), 对任意的(i=1,...,m), 则原问题和对偶问题是强对偶的。

证明：
   我们不妨假设仿射函数：
(h_{i}(x)=sum_{j=1}^{n}a_{ij}x_{j}+b_{i}), 且矩阵(A=(a_{ij}))满足(rank(A)=p),否则我们可以进一步减少等式约束条件的数量，得到等价的凸优化问题，而(d^{ast})保持不变。

我们令集合：

[mathcal{B}=lbrace (u,0,t)in mathbb{R}^{m} imesmathbb{R}^{p} imesmathbb{R}mid upreceq 0,t<p^{ast} brace$$, 此时$mathcal{B}$与上镜集$mathcal{A}$交集为空，它们均为凸集。于是由凸集分离定理，存在超平面分离两集合，也就是存在着$(lambda_{0}, u_{0},t_{0}) eq 0inmathbb{R}^{m} imesmathbb{R}^{p} imesmathbb{R}$以及$binmathbb{R}$使得：对任意的$xin D$, $xi in mathbb{R}_{+}^{m}$和$tinmathbb{R}_{+}$： egin{equation}sum_{i=1}^{m}lambda_{0,i}(f_{i}(x)+xi_{i})+sum_{i=1}^{p}v_{0,i}h_{i}(x)+t_{0}(f_{0}(x)+t)geq bend{equation} 且对任意的$uin mathbb{R}^{m}$,$upreceq 0$, $t<p^{ast}$: egin{equation}lambda_{0}cdot u+t_{0}tleq bend{equation} 由（9）中的任意性我们立即可以知道$lambda_{0}succeq 0$,$t_{0}geq 0$, 这时我们令(10)中$u ightarrow 0$,$t ightarrow p^{ast}$，可以知：$t_{0}p^{ast}leq b$，于是我们再结合（9）可知对任意$xin D$： egin{equation}sum_{i=1}^{m}lambda_{0,i}f_{i}(x)+sum_{i=1}^{p}v_{0,i}h_{i}(x)+t_{0}f_{0}(x)geq t_{0}p^{ast}.end{equation} 我们注意到，如果这时候$t_{0}>0$则上式两边同时除以$t_{0}$我们立即得到对任意的$xin D$： $$L(x,lambda_{0}/t_{0}, u_{0}/t_{0})geq p^{ast},]
这时我们立即得到：
(g(lambda_{0}/t_{0}, u_{0}/t_{0})geq p^{ast}), 于是强对偶成立。

此时我们假设(t_{0}>0)不成立，则(t_{0}=0),对任意(xin D)：
egin{equation}sum_{i=1}^{{m}lambda_{0,i}f_{i}(x)+sum_{i=1}}{p}v_{0,i}h_{i}(x)geq 0.end{equation}
这时由于( ilde{x}in ext{relint} D), 且(f_{i}( ilde{x})<0(i=1,...,m)), 所以存在一个(x)在(D)的仿射闭包中的领域(U), (Usubset D)，且(f_{i}<0(i=1,...,m))在D上恒成立,这时结合(lambda_{0,i}geq 0)我们立即知道对任意(xin U)：
egin{equation}sum_{i=1}^{p}v_{0,i}h_{i}(x)geq -sum_{i=1}^{m}lambda_{0,i}f_{i}(x)geq 0end{equation}
注意到仿射函数：(sum_{i=1}^{p}v_{0,i}h_{i})在( ilde{x})处取(0),如果它非恒为(0),则必然在(U)内取值有正有负，所以(sum_{i=1}^{p}v_{0,i}h_{i})恒为零，由假设(rank(A)=p)我们立即得到( u_{0}=0), 于是：
egin{equation}sum_{i=1}^{m}lambda_{0,i}f_{i}( ilde{x})geq 0,end{equation}
这时由于(lambda_{0,i}geq 0), (f_{i}( ilde{x})<0), (i=1,...,m)我们立即得到(lambda_{0}=0), 这与((lambda_{0}, u_{0},t_{0}) eq 0)矛盾，于是(t_{0})必然大于0,命题得证。

5.参考文献：
Stephen Boyd，Lieven Vandenberghe：Convex Optimization，cambridge university press 2004，Cambridge, New York, Melbourne, Madrid, Cape Town, Singapore, S˜ao Paolo, Delhi
相关阅读:
404. 左叶子之和
 112. 路径总和
 110. 平衡二叉树
 513. 找树左下角的值
 博客第一天
 博客开通第七天
 博客第二天
 超级实用且不花哨的js代码大全
 利用OleDb的GetOLEDBSchemaTable方法得到数据库架构信息.NET教程,数据库应用
 实现给定一个数据库连接得到数据库下所有的数据表
原文地址：https://www.cnblogs.com/szqfreiburger/p/11573939.html

Lagrangian 对偶 和 Slater 条件

1.Lagrange函数:

2.Lagrange对偶函数和对偶问题:

3.几何解释:

5.参考文献：

Lagrangian 对偶和 Slater 条件