• 拉格朗日乘子法


    拉格朗日乘子法最小值转化为对偶函数最大值问题在SVM部分有很重要的作用,今天详细听了邹博老师凸优化课程关于这部分的讲解,做一个小小的总结。

    一、知识铺垫

    1. 保凸算子

    凸函数的非负加权和 : 

    凸函数与仿射函数的复合: 

    凸函数的逐点最大值、逐点上确界:

    第一个和第二个直接使用定义还是挺简单的,因为后边也要用到,这里给出第三个的证明:

    第二个不等式直观上来看:

    得到一个后边需要用的结论:几个凸函数逐个取大得到的函数任然是凸函数,几个凸函数逐个取小得到的函数是凹函数。取几个凸函数为直线,得到下边这样的一个示意图。

     

     二、凸优化问题的定义

    若fi(x)为凸函数,hj(x)为仿射函数,则为一个凸优化问题。

    凸优化问题的可行域为凸集,凸优化问题的局部最优解即为全局最优解。

     

    三、凸优化问题的对偶问题

    3.1 基本分析

    我们可以知道,对偶函数为一个凹函数,一定存在最大值。(之前证明过,几个凸函数的min为凹函数)

    对偶函数的最大值一定小于等于原函数的最小值,那么求原函数的最小值是否就可以转化为对偶函数的最大值呢?我们使用这样一个图来分析:

    如图,下边的虚线部分表示了一个凸函数f1(x),假设lambda1 = 0,那么没有影响,原函数最小值大概为1.35,但是随着lambda1的初步增大,最小值点会往上移动,对应于我们的原函数上面的虚线。但是lambda1继续增大的时候,最小值点变了,所以最小值点又开始下降了。最终得到如右边所示的一个最小值关于lambda1的变化趋势图。

    由以上分析可知,原问题的最小值可以转化为对偶问题的最大值问题。(第二项最大值为0,第三项就是0)

    3.2鞍点解释

    3.3强对偶条件

  • 相关阅读:
    Linux下修改HOSTNAME
    IBM服务器 IMM日志收集
    X3850 Linux 下DSA日志收集办法
    Linux查看进程内存占用及内存使用情况
    集成开发注意事项(持续更新)
    SOAPUI请求及mockservice 使用
    Linux下su与su -命令的区别
    从XML文件中获取格式化的文本信息
    前端实现下载文件
    动态表单如何对部分表单字段校验
  • 原文地址:https://www.cnblogs.com/futurehau/p/6079647.html
Copyright © 2020-2023  润新知