本周开始着手准备了中国软件杯比赛的作品,所以本周学习了使用python和tesseract-ocr来实现对一种图片里面文字的识别。
首先是要安装tesseract-ocr软件,这要到GitHub上去寻找安装包,下载好了之后开始安装:
然后点击next
继续点击next,展开最后一项选择语言chi_sim(简体中文)然后点击next
选择安装路径,点击next
点击安装,等待安装成功
然后再在环境变量中写入安装的地址即可。
然后需要在pycharm中下载两个库:PIL和pytesseract,然后还要配置pytesseract.py文件
将该处的地址修改为你本人的tesseract安装路径即可然后再编写代码,
制定路径的图片中的信息就会打印出来了。