• 斯坦福大学11月份的论文《NECST:Nerual Joint Source-Channel Coding》


    文章简要概括:文中提出了一种神经纠错和信源修剪码(NECST:Neural Error Correcting and Source Trimming),即通过端到端的方式去学习联合编码和解码。

    针对于如何将图像数据编码为比特流,使得其能够在带噪通信信道中进行可靠地传输这一问题,香农的结论是对于一个无记忆信道,当图像大小趋于无穷时,最好地方法是将信源编码(去冗余,尽可能压缩)和信道编码(抗干扰,加入冗余)这两个过程分离开来。然而,当在有限比特长度的情况下,香农的这一分离方法面临两大限制,一方面,没有了无限长的比特数用于传播,整体的失真(即重建质量)成了信源编码和信道编码误差两者的函数,如何给两个过程分别分配多少比特数,以及码的自身设计成了一个极其困难的问题。另一方面,最大似然解码通常是NP难的。

    而NECST是一个在给定比特长度下,去联合地学习如何压缩和纠错输入图像的深度学习框架。主要分为三个步骤:(1)使用NN将每个图像编码成一个合适的比特流表示,从而回避了通过手工设计的编码方案,后者为了好性能,通常需要额外的微调;

    (2)在模型中仿真了一个离散信道,并给隐码(latent code)直接加入了噪声来确保鲁棒性;

    (3)将解码过程分摊(amortize),从而可以扩展到大规模数据集。

    但由于离散随机隐变量的不可微性,文中采用了无偏差低方差梯度估计的相关新技术,通过将图像和它们的二元(比特流)表示间的互信息的变分下界作为目标函数,从而训练模型来获得鲁棒的码。NECST也可以看作一个隐式生成模型。

    文中最后在灰度图和RGB图像数据集上进行了实验,相对于工业标准压缩(如JPEG)和纠错码(如LDPC码),NECST有了显著的性能提升。同时,解码部分,和基于迭代置信传播的标准解码算法相比,NECST速度有了一个数量级的提升,在GPU上则有两个数量级的提升。而且,其学习到的离散表示可以用于下游任务如分类。

    编码过程:sum

  • 相关阅读:
    sublime Text3 常用插件
    No input file specified. nginx服务器报错解决
    has~和belongsTo的区别?
    关于在phpStudy环境下,windows cmd中 php不是内部命令问题
    spring @RequestMapping注解技巧
    VIM快捷键
    Thinkphp5 模块的自动生成
    在php中define和const定义常量的区别
    go语言学习(六)——并发编程
    go语言学习(五)——面向对象编程
  • 原文地址:https://www.cnblogs.com/SmartCommunication/p/10125511.html
Copyright © 2020-2023  润新知