阅读论文
1.如何选择论文?
(1)综述论文:对某一领域的研究历史和现状的相关方法、算法进行汇总,对比分析,同时分析该领域未来发展方向。
(2)专题论文:具体的算法、模型的提出。有了相关基础知识,我们就可以进入具体算法论文当中去学习其设计思路,实验技巧,代码实现等具体技术。
高质量期刊会议:CVPR、ECCV、ICCV、AAAI、NIPS、ICLR、ICML等
知名团队:Yoshua Bengio、Yann LeCun、Geoffrey Hinton、 Andrew Ng、斯坦福Chris Manning课题组,UIUC韩家炜教授课题组,哈工大刘挺教授课题组(SCIR),南京大学周志华教授课题组(LAMDA),清华大学刘知远教授课题组等)
2.哪里找论文?
未知题目论文可借助平台:
(1)知网、百度学术和google scholar,arXiv(预印本平台),顶会直接搜索论文
(2)分类较为齐全的 论文+代码:https://paperswithcode.com/
(3)MIT学生做的代表性优秀论文:https://www.stateoftheart.ai/
(4)重要会议:
(4.1)Visually: https://nips2018vigil.github.io/
(4.2)LBI: https://sites.google.com/view/lbi2018/accepted-papers
(5)顶会论文链接:
- https://jeffhuang.com/best_paper_awards/
- CV:http://www.cvpapers.com/
- https://github.com/terryum/awesome-deep-learning-papers
- 目标检测:https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html
- 计算机视觉:http://www.visionbib.com/bibliography/contents.html
- https://github.com/hoya012/deep_learning_object_detection#2014
- http://www.visionbib.com/bibliography/contentspeople.html#Face%20Recognition,%20Detection,%20Tracking,%20Gesture%20Recognition,%20Fingerprints,%20Biometrics
- https://github.com/kjw0612/awesome-deep-vision
- https://github.com/jbhuang0604/awesome-computer-vision
- https://www.paperswithcode.com/
- https://www.sciencedirect.com/
- 每年论文集:https://openaccess.thecvf.com/menu
已知题目论文可借助平台:
(1)SIC-Hub: https://www.sci-hub.ren/
(2)预发布平台:https://arxiv.org/
(3)关注顶会:CVPR、ECCV、ICCV、AAAI、NIPS、ICLR、ICML等
- 全领域综合:NIPS,ICML,AAAI,IJCAI
- 机器视觉:CVPR,ICCV,ECCV
- 深度学习及表示学习(认知科学研究):ICLR
- 音频识别:ICASSP,interspeech
- 自然语言处理:ACL,EMNLP
- 知识表达与推理:UAI,KR
- 数据挖掘:KDD,ICDM,SDM
- 信息检索:SIGIR
3.如何筛选优质论文?
(3)如何筛选优质论文:期刊影响因子、分区。
- 影响因子计算:采用期刊前N年发表的论文被引数/前N年发表的论文数 (N=2或5)
- 分区:分区的方式主要有两种,一种是JCR,一种是中科院。JCR是国际通用的方式,而中科院的方式仅在中国适用
4.如何管理论文?
1、PDF格式论文通过命名进行管理。推荐三种命名格式:时间-作者-题名的方式, 或者时间-关键词-题名的方式, 或者时间-关键词-题名-作者的方式。
将同一个作者的同一个研究进行归类,可以清晰的看出这个研究的发展。 除了规范的命名,我们还需要将同类的论文放到同一个文件夹中,方便我们查找。
2、论文管理软件: 如果涉及成百上千的论文管理,那么推荐使用论文管理软件。
常用的有endnote,mendeley,Zotero等等,大家可以根据需要自行下载安装管理软件。 【这里提醒大家,endnote是收费的,mendeley是免费的】
5.如何阅读论文?
这里泛读的作用就是快速浏览,把握概要,先看看桌上有哪些内容,哪些内容是要看的,哪些是不看的。
泛读阶段,我们重点读标题、摘要、结论以及所有的小标题和图标。从题目可得知拿什么东西解决什么问题。摘要了解论文的概要,清楚采用什么方法,解决什么问题,达到什么效果。看标题则是划分内容。接着还要把论文的结论,所有的图片和表格进行浏览,更近一步了解论文中有哪些论证,举例,内容说明。
最最重要的就是总结。总结是对论文的创新点、关键点和启发点进行摘抄记录。 对于有写论文发论文需要的同学来说,这一步是至关重要的,对论文的总结是为课题提出创新点打下基础。
6.论文结构
这里总结为6个主要部分。
1、摘要,摘要主要讲论文简介,阐述工作内容,创新点,效果
2.、引言部分介绍研究背景,研究意义,发展历程,提出问题
3、相关工作相关研究算法简介,分析存在的缺点
4.、本文工作论文主要方法,实现细节
5、实验部分,介绍算法实现步骤及结果分析
6、探讨部分,论文结论及未来可研究方向
7.如何更高效地阅读论文,并通过论文熟悉某个方向领域
基础必不可少。 这里总结了必备的基础知识,我们来看一下。
1、Python基础,这是毋庸置疑的必备基础,我们后边代码实现就是基于python语言。
2、数学基础,包含矩阵计算、概率论和信息论,矩阵计算在CV领域是必备知识,概率论与信息论在NLP中也是常见的概念。
3、神经网络基础,由于深度学习属于神经网络,因此神经网络的内容必须要了解,特别地,对于CV领域CNN是很重要的,大多数CV任务已经被CNN统治,对于NLP领域而言,RNN是必不可少的知识。
4、除了理论基础,实践的基础就是现在最热门的深度学习框架PyTorch,我们需要了解如何利用pytorch实现数据读取,数据增强,如何构建模型,如何设置损失函数优化器等等。 那为什么选择Pytorch呢?因为PyTorch是现在最适合新手入门的框架,代码简洁易读懂,并且目前最前沿的技术,论文,大多数都有pytorch的实现,学会pytorch可以快速的紧跟前沿技术。
有了理论和实践的基础,就要针对CV和NLP两个方向进行选择,CV和NLP有着各自领域基础,大家要根据自己方向进行基础知识的巩固学习。 对于CV领域,我们需要知道图像基础知识,图像的基本处理方法等等内容 对于NLP方向,我们需要了解什么是词袋,分布特征是什么,tfidf权重,等基础知识。
那我们巩固好理论、实践、方向领域上的基础之后,就可以进入论文的baseline cv方向,你应该选择领域内引用高,同行间普遍熟知的论文,包含alexnet vggnet googlenet resnet等等。 NLP方向的baseline,你应该选择开创性、引用高和应用到实际业务的论文,主要覆盖词向量、nlp深度学习主流框架和应用,预训练模型等主流方向,做到兼顾科研和工业应用平衡。
熟悉了baseline论文,就算是入了门,接着就可以根据自己研究方向及感兴趣的方向选择性的学习专题论文。 对于CV常见的有OCR、GAN、知识蒸馏、目标检测、图像分割等等。 对于NLP有文本分类,句子匹配,关系抽取等等。
从中找到你想要研究的专题是很重要的,如果你在初期阶段,对细分专题没什么概念,你也可以初步都学习了解一下,找到自己感兴趣的专题,针对特定研究方向,深入学习。