2018 经典的CVPR 关于ImageCaptioning论文

2018 经典的CVPR 关于ImageCaptioning论文

1.        SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text(2018 CVPR)

主要研究方向：本论文主要是做语言风格，就是对同一张图片有多种描述。

2.        Neural Baby Talk（2018 cvpr）

主要研究内容：对于图片的描述更多的应该是基于图像内容，而不是基于语言模型去推理；如果是非常见场景，那么模型就差强人意。

3.        Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering（2018 CVPR）

主要研究内容：针对attention之前输入的是均等化图片格子，而不是具体的如同人眼观察到的图像内容，故而本论文是先用faster-RCNN检测得到feature map，而后对其加权，再进行转化为自然语言。

4.        GroupCap: Group-based Image Captioning with Structured Relevance and Diversity Constraints

研究motivation：1.当前研究都是基于单张图片，没有基于多张图片去做；2.当前只有多样性的的研究，而没有图片相关性的研究。

应用场景：对于图相册的captioning任务。

数据集：http://mac.xmu.edu.cn/Data_cvpr18.html (基于MSCOCO更改而成)

5.        Image Caption Generation with Hierarchical Contextual Visual Spatial Attention

主要研究方向：这里提出的注意力机制考虑了图片region之间的上下文。
相关阅读:
vue+filesaver+xlsx导出table为excel
layer弹窗第一次不居中。然后再点击就居中了。解决办法
 GitHub的Fork 是什么意思
 什么时候会发送options请求
 实现H5连接分享给好友或朋友圈自定义分享内容（标题、图片、简介）的方法代码
 vue的element的table表头自定义添加按钮
 小程序配置体验版添加参数
 迅为iMX8M Mini开发板硬件接口原理分析
 迅为i.MX8MM 核心板引脚说明（按功能划分）
迅为3399开发板Ubuntu 系统双屏异显，双屏同显测试
原文地址：https://www.cnblogs.com/AntonioSu/p/12080124.html