python语言知识
1.廖雪峰的官方网站
适合快速上手python
2.python官网文档
适合上手之后及时查阅
C++
1.cpplearn(需fq)
公益的在线教程,保持更新,细节讲解不错,适合上手
深度学习入门
1.a step-by-step introduction to the basic object detection algorithm(需fq)
不只对目标检测,cv和部分nlp的算法也都有介绍,同时包含外部连接指向斯坦福的一些高质量的公开课节选
2.cs231n: Convolutional Neural Networks for Visual Recognition(需fq)
华人教授李菲菲的深度学习公开课
cnn模型
1.Fully Convolutional Networks for Semantic Segmentation
文章介绍了如何利用全连接卷积网络做语义分割,其中提出了一个叫“Shift-and-stitch”的图像处理方法
2.VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
文中通过压缩卷积核大小并增加深度来减少超参数的数量,提出了大名鼎鼎的vgg-16和vgg-19网络结构
文档处理相关(主要是表格)
1.Rethinking Table Recognition using Graph Neural Networks
论文综述值得一看,大概梳理了表格识别任务从1998-2018的表格提取任务的相关研究工作,可用来梳理表格文档相关技术的脉络
2.Table Detection using Deep Learning
使用UNLV数据集并利用Faster-rcnn做表格识别,里面对表格文档的预处理写的很不错,同时与其他ocr实现方法如tesseract做了对比
3.TableNet
使用VGG19网络结构做表格结构识别
4.Table Structure Recognition and Its Evaluation
针对表格的位置(position)关系做了非常多分析,并也利用了其空间结构构建多分类预测模型
5.The T-Recs Table Recognition and Analysis System
是第一个进行表格识别的论文方法,提出了一种由下至上的文档组织结构T-Recs。T-Recs的中心思想是识别属于同一种逻辑单元的单词,其组织顺序由下之上分别为单词、块、文档
6.