百度AI开放平台——教学视频——基础视觉 - 润新知

百度AI开放平台——教学视频——基础视觉

文字识别基础介绍及应用场景

百度OCR介绍

OCR基本概念

OCR（Optical Character Recongnition）：图像文字识别——让计算机和人一样看图识字的人工智能技术。

OCR API接口整体架构图

算法架构：

系统架构：

百度OCR优势

文字识别服务–性能数据

深度学习算法——>数千万PV产品群——>千万级别训练数据——>深度学习算法

语种支持：支持中、英、日、韩、葡、德、法、意、西、俄等十国语言
系统性能：平均耗时500ms
支持产品线：手机百度、百度钱包、百度糯米、百度外卖、百度翻译、百度贴吧、百度推广、涂书笔记、百度地图、百度图片搜索等

文字识别服务–技术优势

公开数据集指标：ICDAR竞赛5项世界第一

DEMO演示

OCR功能介绍

通用OCR：多项ICDAR指标世界第一，支持10多种语言的识别，识别率90%以上。
身份证OCR：可识别所有字段，对倾斜、暗光、曝光、阴影等异常情况稳定性好、识别准确率高达98%以上。
银行卡OCR：可准确识别所有主流银行卡卡号，识别率高达98%以上。
（Demo入口：http://ai.baidu.com）

文字识别API接入介绍

百度OCR API功能及案例

OCR功能

文字识别服务（OCR）——通用场景

文字识别服务（OCR）——金融场景

文字识别服务（OCR）——反作弊场景

自定义模板文字识别基础介绍

用户痛点

现有的通用OCR技术无法找到“字段名”和“字段值”的对应关系。

方案

使用字段之间的相对位置关系，结合百度强大的NLP技术，实现“字段名”和“字段值”的匹配输出。

优势

1.全场景——用户自主定义识别模板，轻松适配所有场景。
2.简单易用——界面花的模板制作过程，5min即可完成一个模板的制作。
3.更智能——对旋转、扭曲的图片进行智能的图片矫正。

自定义模板文字识别实际操作演示

http://abcinstitute.baidu.com/pages/index.html#/video/?courseId=14723&elementId=21932222-e9c7-4f6b-82de-bea1071d2837&userId=6749125&groupId=479938&_k=kgn6cb

图像定制化训练平台使用教程

http://abcinstitute.baidu.com/pages/index.html#/video/?courseId=14719&elementId=e8d488d5-474e-4b90-97c6-754e000c8e80&userId=6749129&groupId=479934&_k=c3tdur
相关阅读:
深入浅出聊优化：从Draw Calls到GC
关于Unity中植物树木烘焙后没有影子的解决方法
 Marvelous Designer 服装设计与模拟
 DAZ studio 4.9基础
 在下载SOPC代码的过程中遇到的一些错误
 开发工程师人生之路
 简易信号发生器的设计
 HDU A Simple Math Problem （矩阵快速幂）
HDU Queuing (递推+矩阵快速幂)
POJ 3233 Matrix Power Series（矩阵快速幂）
原文地址：https://www.cnblogs.com/AlexKing007/p/12339373.html

Copyright © 2020-2023 润新知