• Geometric GAN


    Jae Hyun Lim, Jong Chul Ye, Geometric GAN.

    很有趣, GAN的训练过程可以分成

    1. 寻找一个超平面区分real和fake;
    2. 训练判别器, 使得real和fake分得更开;
    3. 训练生成器, 使得real趋向错分一侧.

    主要内容

    在这里插入图片描述

    McGAN

    本文启发自McGAN, 在此基础上, 有了下文.

    结合SVM

    设想, GAN的判别器(D(x) = S(langle w, Phi_{zeta}(x) angle)), 其中(S)是一个激活函数, 常见如sigmoid, 先假设其为identity(即(D(x)=langle w, Phi_{zeta}(x) angle)).

    McGAN 是借助(langle w, Phi_{zeta}(x) angle)来构建IPM, 并通过此来训练GAN. 但是,注意到, 若将(Phi_{zeta}(x))视作从(x)中提取出来的特征, 则(langle w, Phi_{zeta}(x) angle)便是利用线性分类器进行分类,那么很自然地可以将SVM引入其中(训练判别器的过程.

    [egin{array}{rcl} min_{w, b} & frac{1}{2} |w|^2 + C sum_i (xi_i + xi_i') & \ mathrm{subject : to} & langle w, Phi_{zeta}(x_i) angle + b ge 1-xi_i & i=1,ldots, n\ & langle w, Phi_{zeta}(g_{ heta}(z_i)) angle + b le xi_i'-1 & i=1,ldots,n \ & xi_i, xi_i' ge 0, : i=1,ldots,n. end{array} ]

    类似于

    [ ag{13} min_{w,b} : R_{ heta}(w,b;zeta), ]

    其中

    [ ag{14} egin{array}{ll} R_{ heta}(w,b;zeta) = & frac{1}{2C n} |w|^2 + frac{1}{n} sum_{i=1}^n max (0, 1-langle w, Phi_{zeta} (x_i) angle -b) \ & + frac{1}{n} sum_{i=1}^n max (0, 1+ langle w, Phi_{zeta}(g_{ heta}(z_i)) angle+b). end{array} ]

    进一步地, 用以训练(zeta):

    [ ag{15} min_{w,b,zeta} : R_{ heta}(w,b;zeta). ]

    SVM关于(w)有如下最优解

    [w^{SVM} := sum_{i=1}^n alpha_i Phi_{zeta}(x_i) - sum_{i=1}^n eta_i Phi_{zeta} (g_{ heta}(z_i)), ]

    其中(alpha_i, eta_i)只有对支持向量非零.

    定义

    [mathcal{M} = {phi in Xi | |langle w^{SVM}, phi angle + b | le 1} ]

    为margin上及其内部区域的点.
    在这里插入图片描述

    于是

    [ ag{18} egin{array}{ll} R_{ heta}(w,b;zeta) = frac{1}{n} sum_{i=1}^n langle w^{SVM}, s_i Phi_{zeta} (g_{ heta}(z_i))-t_i Phi_{zeta}(x_i) angle + mathrm{constant}, end{array} ]

    其中

    [ ag{19} t_i = left { egin{array}{ll} 1, & Phi_{zeta}(x_i) in mathcal{M} \ 0, & mathrm{otherwise} end{array} ight. , quad s_i = left { egin{array}{ll} 1, & Phi_{zeta}(g_{ heta}(z_i)) in mathcal{M}\ 0, & mathrm{otherwise}. end{array} ight. ]

    训练(zeta)

    于是(zeta)由此来训练

    [zeta leftarrow zeta +eta frac{1}{n} sum_{i=1}^n langle w^{SVM}, t_i abla_{zeta} Phi_{zeta}(x_i) - s_i abla_{zeta}Phi_{zeta} (g_{ heta}(z_i)) angle . ]

    训练(g_{ heta})

    就是固定(w,b,zeta)训练( heta).

    所以

    [min_{ heta} : L_{w, b, zeta}( heta), ]

    其中

    [L_{w,b,zeta}( heta)= -frac{1}{n} sum_{i=1}^n D(g_{ heta}(z_i)), ]

    [ heta leftarrow heta+eta frac{1}{n} sum_{i=1}^n langle w^{SVM}, s_i abla_{ heta}Phi_{zeta} (g_{ heta}(z_i)) angle . ]

    理论分析

    (n ightarrow infty)的时候
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    定理1: 假设((D^*,g^*))是(24), (25)交替最小化解, 则(p_{g^*}(x)=p_x(x))几乎处处成立, 此时(R(D^*,G^*)=2).

    注: 假体最小化是指在固定(g^*)下, (R(D^*,g^*))最小,在固定(D^*)(L(D^*,g^*))最小.

    证明

    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述

    注:文中附录分析了各种GAN的超平面分割解释, 挺有意思的.

  • 相关阅读:
    udelay、mdelay、ndelay、msleep使用比较说明
    linux多线程驱动中调用udelay()对整个系统造成的影响(by liukun321咕唧咕唧)
    linux设备驱动那点事儿之平台设备理论篇
    misc_register、 register_chrdev 的区别总结
    platform_driver与file_operations两种方法开发led驱动
    rc522 ,pn544区别
    内核驱动中常见的miscdevice、platform_device、platform_driver
    file_operations结构2
    file_operations结构体解析 1
    android5.0问题
  • 原文地址:https://www.cnblogs.com/MTandHJ/p/12716339.html
Copyright © 2020-2023  润新知