我的环境为python3
坑比较多,在此做记录,以备查阅
命令行安装:
pip install PIL
pip install pytesseract
pip install Pillow
下载tesseract-ocr安装包和中文包
将tesseract.exe添加到环境变量PATH中D:Program Files (x86)Tesseract-OCR
将语言包文件目录加入到环境变量中D:Program Files (x86)Tesseract-OCR essdata
增加一个TESSDATA_PREFIX环境变量,并设置目录:D:Program Files (x86)Tesseract-OCR
修改C:PythonLibsite-packagespytesseractpytesseract.py文件
tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
测试程序如下:
from PIL import Image import pytesseract text=pytesseract.image_to_string(Image.open('C:/Python/456.jpg'),lang='chi_sim') print(text)