文字识别基础介绍及应用场景
百度OCR介绍
OCR基本概念
OCR(Optical Character Recongnition):图像文字识别——让计算机和人一样看图识字的人工智能技术。
OCR API接口整体架构图
算法架构:
系统架构:
百度OCR优势
文字识别服务–性能数据
深度学习算法——>数千万PV产品群——>千万级别训练数据——>深度学习算法
语种支持:支持中、英、日、韩、葡、德、法、意、西、俄等十国语言
系统性能:平均耗时500ms
支持产品线:手机百度、百度钱包、百度糯米、百度外卖、百度翻译、百度贴吧、百度推广、涂书笔记、百度地图、百度图片搜索等
文字识别服务–技术优势
公开数据集指标:ICDAR竞赛5项世界第一
DEMO演示
OCR功能介绍
通用OCR:多项ICDAR指标世界第一,支持10多种语言的识别,识别率90%以上。
身份证OCR:可识别所有字段,对倾斜、暗光、曝光、阴影等异常情况稳定性好、识别准确率高达98%以上。
银行卡OCR:可准确识别所有主流银行卡卡号,识别率高达98%以上。
(Demo入口:http://ai.baidu.com)
文字识别API接入介绍
百度OCR API功能及案例
OCR功能
文字识别服务(OCR)——通用场景
文字识别服务(OCR)——金融场景
文字识别服务(OCR)——反作弊场景
自定义模板文字识别基础介绍
用户痛点
现有的通用OCR技术无法找到“字段名”和“字段值”的对应关系。
方案
使用字段之间的相对位置关系,结合百度强大的NLP技术,实现“字段名”和“字段值”的匹配输出。
优势
1.全场景——用户自主定义识别模板,轻松适配所有场景。
2.简单易用——界面花的模板制作过程,5min即可完成一个模板的制作。
3.更智能——对旋转、扭曲的图片进行智能的图片矫正。