• OCR研究现状


    参考:https://www.zhihu.com/question/20191727

    1、汉字识别以前主要采用最近邻分类器(KNN)和修正二次判别函数(MQDF),主要是针对扫描文档OCR和手写汉字OCR。当然现在深度学习发展迅猛,卷积神经网络(CNN)已经开始大行其道,具体可以看看百度深度学习研究院的技术报告。

    2、刚好现在在公司做OCR和STR, 现在主流的方法是CNN(基于featuremap的文字检测)+lstm(任意序列的文字行识别),ICDAR2015文字竞赛上top的成绩基本都是这种方法了,另外题主如果想实现end to end的训练和预测可以直接考虑简单暴力的fasterrcnn,出来的结果用cnn过滤下可以达到ICDAR几个challenge的top3.

    3、补充一个小算法,自然场景的识别的话,还得加一个文本定位。一般常用的是SWT(笔画宽度变换)算法。用这个把图片中的字符区域定位出来再识别效果会好很多。 github有一些ImageTextExtraction项目

    4、直接 CNN,简单粗暴有效,老的特征过程不用学了,马上淘汰。

    5、我花了一年的时间做了一个蒙古文的OCR识别率在95%以上。且是用Python写的所以源码200+行。 上面的朋友们都大体说的差不多了只是我个人觉得OCR的最费时间的地方是训练样本!我在这个地方(由于我的笔记本性能不是太好)花了很长的时间去弄的到现在我的识别率提不上去就是因为我的样本不够多的问题而样本多了电脑会受不了的。而且从几十万个小图片中找到识别错误的图片可不是一件简单的事情啊。需要很大的耐心和毅力而且这是一个长期的任务。希望你加油。

    -佩服!业内句话是,more data usually beats better algorithms,确实是这个道理。

    -如果只有200行代码,我估计你用的是python 的库的吧?tessrac

    -天啊,真是佩服。。。有考虑过用AWS和Mechanical Turk吗?

    -还没有 因为我这个项目bp够用了所以就没想着用其他的技术

    6、主要是图像的处理,包括灰度处理、二值化、去噪、旋转、水平切割、垂直切割
    然后再用特征提取+识别

    7、作者:庾金科 链接:https://www.zhihu.com/question/20191727/answer/99677591 来源:知乎 著作权归作者所有,转载请联系作者获得授权。

    其实主要问题还是Text Detection。
    单个字符 OCR的话 传统的就是特征工程+分类器。 一般流程是 灰度 -> 二值化->矫正图像 -> 提取特征(方法多种多样例如pca lbp 等等) ->分类器(分类器大致有SVM ANN KNN等等 )。
    不过现在很火的 CNN(卷积神经网络)可以很大程度上免去特征工程。直接往cnn里面塞图像就行了。不过相对来说后期调参难度也比较大。
    用CNN做的车牌的中文字符识别,识别率98.41% http://blog.csdn.net/relocy/article/details/50989742
    还有一点就是端到端(end to end)的识别,但前提是你需要大量的标注好的数据集。 这种方法可以不分割图像直接以连续的输出字符序列。
    对于短长度的可以使用mutli-label classification 。比如像车牌,验证码。 这里我试过一个车牌的多标签分类。 车牌识别中的不分割字符的端到端(End-to-End)识别
    google做街景门牌号识别就是用的这种方法。
    如果字符序列长度较比如很长的手写体 而且不固定的话。可以使用类似于语音识别中采用的方法,让训练好的单个字符分类器在序列图像上滑动,输出概率图,接着用 lstm cnn 等序列模型 输出字符序列。
     
    8、你中文每个字的图片库怎么获取的?训练的时候分成几千类么?
    -用 imagemagick 生成,同时混合少量真实图片中得到的标注数据;是的,分成几千类
  • 相关阅读:
    2.分布式锁
    1. junit用法,before,beforeClass,test,after, afterClass的执行顺序
    GC算法
    记一次"截图"功能的前期调研过程!
    程序员转行手册!
    Yarn详细的工作流程
    Yarn的三种调度器(Scheduler)
    Hadoop序列化与Java序列化的区别
    MapReduce执行过程
    从普通登录到单点登录图例
  • 原文地址:https://www.cnblogs.com/Crysaty/p/6085727.html
Copyright © 2020-2023  润新知