• 教你如何用几行Python代码识别图片文字--就是这么简单!


    今天给大家分享的主题是用百度的接口实现图片的文字识别。

    环境和配置要求

    整体是用 Python 实现,所需要使用的第三方库包括 aip 、 PIL 、 keyboard 、 pyinstaller ,如未安装,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。

    百度接口

    打开https://cloud.baidu.com/,

    如未注册请先注册,然后登录点击管理控制台,点击左侧产品 服务 → 人工智能 → 文字识别 ,点击创建应用,输入应用名称如 Baidu_OCR ,选择用途如 学习办公 ,最后进行简单应用描述,即可点击 立即创建 。

    会出现应用列表,包括 AppID、API Key、Secret Key 等信息,这些稍后会用到。

    打开步骤

    具体实现步骤

    整个程序的大致思路是,在用截图软件获得截图之后,交给百度接口识别,并返回结果,当然,也可以是本地图片识别,我用的是QQ自带截图软件,快捷键CTRL+ALT+A用来打开截图,在选中所截区域后,按Enter键即可保存到粘贴板中,也可用其他截图软件。

    ①获取截图

    keyboard类库是用来监听键盘动作的,所以在有快捷键按下之后,便会有相应动作。并用PIL中的 ImageGrab 来获取到剪切板中的图片并生成本地图片文件。


    ②调用Baidu aip识别并打印文字

    先用注册时生成的应用的AppID、API Key、Secret Key初始化应用,再读取保存到的图片并打印识别的文字。


    运行结果如图所示:

    运行截图

    我们还可增加一个无限循环使得一直能截图。

    ③调用打包程序生成专属识别文字小程序

    用pyinstaller库实现小程序的打包,生成.exe文件,这样就能随时识别文字了。在命令行中用pyinstaller xxx.py来打包生成exe文件,最后在生成的dist文件夹即可找到xxx.exe文件如下:

    专属文字识别小程序

    附图图片识别案例

    此文转载文,著作权归作者所有,如有侵权联系小编删除!

    原文地址:https://www.tuicool.com/articles/36jErmJ

    需要代码的或者想了解更多的(点击这里下载)

  • 相关阅读:
    delphi 实体类 JSON 数组 TJsonSerializer Deserialize
    IIS 禁止访问:在 Web 服务器上已拒绝目录列表
    ASP.NET 一般处理程序
    .net 架构
    delphi XE8 NetHTTPRequest NetHTTPClient
    ASP.NET web 应用程序项目
    HttpClient
    eclipse Android 开发基础 Activity 窗体 界面
    关闭 iTunes 自动同步
    could not be installed at this time
  • 原文地址:https://www.cnblogs.com/wxys/p/13749200.html
Copyright © 2020-2023  润新知