知乎上有一个提问“计算机视觉领域如何从别人的论文里获取自己的idea?” 非常有意思,这里也总结下:
Cheng Li的回答:找40篇比较新的paper,最好是开源的、你能看懂的、尽可能时髦的、大佬点赞的。然后画一个40*40的矩阵,对角线上的元素不看,还剩下1560个元素。每个元素看看A+B是不是靠谱,虽然可能99%都不靠谱。但是还是有可能筛出来15篇左右的idea,如果考虑交换性可能只有7篇也够了。或者你找40篇比较新的不是你发的oral paper,再找K篇自己的paper,也可以做这个事情,这样就不用排除对角元素了。补充:如果只是A+B需要说明为什么是non-trivial的,一般至少要改成A+B' 或者A+B+C比较容易发。
匿名用户:上面作者的答案看似调侃,但可操作程度很高,甚至很多组就在这么做。不同的是可能是从多个方向取才然后交叉,效果更佳。如果提出了新颖的、效果不错、但无法理论证明的想法(尤其我做的是无监督学习+不平衡数据+集成学习),那这种文章大概率会被毙掉。审稿人有太多方向可以攻击你,比如缺少可靠的baseline,理论不够坚实等等,即使偏应用的数据挖掘会议也不能幸免。反而是那种几个领域交叉一下,你可以说我们把A用在了C上,并借鉴了B,效果拔群。理论基础可以参考文章[1,3,4],剩下的就是加工一下motivation,跑试验证明效果好就可以了。这种套路可行吗?可行,因为我也干过。但为啥要这么做呢,主要还是因为现在投稿数量上升导致的审稿人质量方差大,这导致你必须考虑审稿人能够意识到这文章是背靠大树,踩在前人的肩膀上,靠谱。
邵浩博士:读完非常大量的论文,就会有一些对这个方向的概括性的了解,也会发现这个方向上还没有做好的问题,idea也就自然而然出来了。写论文,无非是四个层面:1)新问题,新方法;2)新问题,老方法;3)老问题,新方法;4)老问题,老方法。从四个方面都可以入手。比如说某篇论文做的是行人识别,用了算法是YOLO3,那么你是不是可以:1)做一个手上拿电脑包的行人识别,改进一下YOLO3,搞一个自己的YOLO3+的算法;2)做一个手上拿电脑包的行人识别,还是使用YOLO3,用大量的实验证明有效性;3)做一个传统的小猫识别,使用改进后的YOLO3+算法。归根结底就一点:读大量大量的论文!
总之,这些回答启发我们,一定要大量的泛读,哪怕听看看标题,看看摘要。论文重要的其实是角度,要非常快的看思路,特别感兴趣的,再去精读。