• StackGAN 阅读笔记


    StackGAN 阅读笔记


    @StackGAN模型架构图 | center

    StackGAN论文下载链接(arxiv)

    创新点

    • 提出多尺度的GAN
      • Stage-I GAN
      • Stage-II GAN

    Stage-I GAN 主要是根据文本描述抓取目标物体的主要形状轮廓和一些基础色块,生成低分辨率的图片。

    Stage-II GAN 修正Stage-I生成的低分辨率图片,并且根据再次阅读文本描述完善细节,生成高分辨率图片。

    • Conditioning Augmentation(条件增强技术)

    如果直接把 (varphi_t) 放入生成器,这个特征空间的维度一般比较高(>100)而训练数据是有限的,所以会造成特征空间不连续,不利于生成器的训练。

    而作者提出的Conditioning Augmenetation是从独立的高斯分布 (N(mu (varphi _{t})) , (Sigma (varphi _{t}))) 中随机采样得到隐含变量,再放入生成器。其中 (mu (varphi _{t}))(Sigma (varphi _{t})) 是关于 (varphi _{t}) 的均值和方差函数。

    另外,作者为了增强平滑度和避免过拟合,为生成器的损失函数增加了以下的正则项:

    [D_{KL}(mathcal{N}(mu(varphi_t),Sigma(varphi_t)) || mathcal{N}(0,I)) ag{2} ]

    损失函数

    GAN的原始目标函数:

    [egin{split} minmaxV(D,G)=&mathbb{E}_{x_ hicksim{p_{data}}}[logD(x)]+\ &mathbb{E}_{z hicksim{p_{data}}}[log(1-D(G(z)))] end{split} ag{1} ]

    StackGAN的目标函数:

    [egin{split} mathcal{L}_{D_{0}}=&mathbb{E}_{(I_0,t) hicksim p_{data}}[logD_0(I_0,varphi_t)]+\ &mathbb{E}_{z hicksim p_z,t hicksim p_{data}}[log(1-D_0(G_0(z,hat{c}),varphi_t)], end{split} ag{3} ]

    [egin{split} mathcal{L}_{G_{0}}=&mathbb{E}_{z hicksim p_z,t hicksim p_{data}}[log(1-D_0(G_0(z,hat{c}),varphi_t)]+\ &lambda D_{KL}(mathcal{N}(mu(varphi_t),Sigma(varphi_t)) || mathcal{N}(0,I)), end{split} ag{4} ]

    实验中作者把 $lambda $ 全部都设置为了1。

    实验数据

    • CUB contains 200 bird species with 11,788 images
      Oxford-102 [21]
    • Oxford-102 contains 8,189 images of flowers from 102 different cat-
      egories.
    • In our experiments, we directly use the pre-trained Inception model for COCO dataset

    实验效果

    @CUB效果
    @左边四列是Oxford-102测试集效果,右边四列是COCO验证集上的效果
    @Inception Score是衡量生成模型的个体特征和整体特征的方法
    @CA技术的效果对比
    @CA技术的Inception score

    复现

    待复现

  • 相关阅读:
    【人生苦短,我学Python】个人学习笔记——str.count方法
    微信支付问题解决
    针对listview上面的按钮点击事件的操作
    Android界面之间的跳转和返回
    贪吃蛇
    数据库的连接
    Android中实现圆的面积的计算问题
    关于安卓环境的搭建问题
    python 获取cpu、内存、硬盘等实时信息 psutil
    python 配置文件
  • 原文地址:https://www.cnblogs.com/ManWingloeng/p/10677368.html
Copyright © 2020-2023  润新知