python Tesseract安装方法
EXE可执行文件地址:http://download.csdn.net/download/whatday/7740469;
下载tesseract-ocr-setup-3.02.02.exe安装包,安装成功后会在相应磁盘下有Tesseract-OCR文件夹
设置path环境变量
还有新建TESSDATA_PREFIX环境变量
D:Program Files (x86)Tesseract-OCR加进去就可以了
tesseract --list-langs #查看Tesseract-OCR支持语言
如果要识别简体中文 就要下载字库
简体中文字库文件下载地址为:http://download.csdn.net/detail/wanghui2008123/7621567下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。
运行下
<pre>
tesseract C://Users/Administrator/Desktop/1.jpg C://Users/Administrator/Desktop/output –l chi_sim
</pre>
然后会生成output.txt文件 打开就可以看到转化的文字