1.下载4.0软件,下一步下一步到成功;
2.安装之后配置环境变量,Path中添加安装路径(默认:C:Program Files (x86)Tesseract-OCR)
3.新增语言库的环境变量,变量名:TESSDATA_PREFIX,变量值(默认:C:Program Files (x86)Tesseract-OCR essdata)
4.测试软件是否可用tesseract -v,能看到版本号就说明安装成功了
5.识别图片的文字(tesseract [in image] [out txt] [lange],如未指定语言,则默认为英文字体库识别)
中文字体库识别:tesseract d:1.png result -l chi_sim,
英文字体库识别:tesseract d:1.png result,
tesseract 4.0中文字库和安装软件(安装时自带英文字库)
百度网盘:https://pan.baidu.com/s/1TiD2Tdez5JVbAhri8cumLA
密码:5mem