1.首先准备环境:
python版本:2.7/3.6
操作系统:windows系统
2.准备工具:
tesseract-ocr(百度网盘地址:https://pan.baidu.com/s/1OL0g1MBzeijD23JN0UGC0Q)
Pycharm(下载地址:http://www.jetbrains.com/pycharm/download/#section=windows)
3.安装相关python包(作者使用的是py2.7)
pip install Pillow
pip install pytesseract
4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:
C:python27Libsite-packagespytesseractpytesseract.py
修改pytesseract.py文件中第24行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
原内容:
修改后内容:
注:新手一定要注意/与的区分
5.打开Pycharm写程序:
在此需要告诉新手的其中aaa.jpg是存放在py脚本的目录下,lang=‘chi_sim’代表中文识别,如果不加无法识别中文
6.运行脚本可以看到结果
特别提醒:如果步骤完全正确,但是运行报错,请卸载pytesseract重新安装问题就会解决(卸载命令pip uninstall pytesseract)