文字识别：CRNN

来自： https://zhuanlan.zhihu.com/p/43534801

代码：https://github.com/bai-shang/OCR_TF_CRNN_CTC

文字检测主要解决的问题是哪里有文字，文字的范围有多大，即定位文本行的所在位置和范围及其布局。

文本识别是在文本行定位的基础上，对文本行内容进行识别，将图像中的文本信息转化为文字信息。文字识别主要解决的问题是每个文字是什么。

所以一般来说，从自然场景图片中进行文本行识别，需要包括三个步骤：

图1 文字识别的步骤

本文的重点是如何对已经定位好的文本行图片进行识别。

常用文本行识别算法主要有两个框架：

CTC是一种Loss计算方法，用CTC代替Softmax Loss，训练样本无需对齐。

CTC特点：

这篇文章的核心，就是将CNN/LSTM/CTC三种方法结合：

提供了一种end2end文本行图片算算法。

相关阅读:
一种简洁明了的权限管理系统
css小技巧（1）
多功能旋转木马轮播实例
jquery双向列表选择器select版
jquery双向列表选择器DIV模拟版
单击页面任何地方关闭隐藏层
用户登录体验之密码框设计
扁平化设计的美感
分析网站的用户行为
app的架构和导航设计

原文地址：https://www.cnblogs.com/Allen-rg/p/10019392.html