命令行使用pip 安装python模块

命令行使用pip 安装python模块
因为没有把pip加入环境变量，so 进入pip对应路径：

C:Python27Scripts>pip install pytesseract

如果pip版本太弱了，升级pip

pip show pip

C:Python27Scripts>pip install --user --upgrade pip

或者用：python -m pip install --upgrade pip -i https://pypi.douban.com/simple

-------------------------------------------------------------------------------
1. 打开cmd
2. 到达安装目录
3. python setup.py build
4. python setup.py install
cd C:Python27Scripts esseract-ocr-0.0.1

pip install pytesseract

pip install --index-url http://pypi.douban.com/simple/ tesseract-ocr

==============================Tesseract-OCR 和 pytesseract 模块安装=======================

语言包下载地址：

3.04版本：https://github.com/tesseract-ocr/tessdata/tree/3.04.00

4.0版本：https://github.com/tesseract-ocr/tessdata

下载中文 chi_sim.traineddata 和 chi_tra.traineddata

一、环境变量配置

1.系统变量Path
```
D:Program FilesTesseract-OCR
```
2.系统自定义变量：TESSDATA_PREFIX
```
D:Program FilesTesseract-OCR	essdata
```
测试：

　【语法】: tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile…]

　　imagename为目标图片文件名，需加格式后缀；outputbase是转换结果文件名；lang是语言名称（在Tesseract-OCR中tessdata文件夹可看到以eng开头的语言文件eng.traineddata），如不标-l eng则默认为eng。

　　tesseract --help

　　tesseract 1.jpg log -l eng (识别英文测试,默认)

　　tesseract 1.jpg log -l chi_sim(识别中文测试)

二、编辑：C:Python27Libsite-packagespytesseractpytesseract.py

32行：
```
# tesseract_cmd = 'tesseract'
tesseract_cmd = u'D:/Program Files/Tesseract-OCR/tesseract.exe'
```
2、Tesseract训练：

因为识别能力很有限，需要进行训练

大体流程为：安装jTessBoxEditor -> 获取样本文件 -> Merge样本文件 –> 生成BOX文件 -> 定义字符配置文件 -> 字符矫正 -> 执行批处理文件 -> 将生成的traineddata放入tessdata中

参考博客：

https://www.cnblogs.com/hupeng1234/p/7136442.html
https://blog.csdn.net/dcba2014/article/details/78969658
http://www.inimei.cn/archives/770.html
https://blog.csdn.net/guzhenping/article/details/80122947
https://www.cnblogs.com/cnlian/p/5765871.html
https://www.cnblogs.com/wzben/p/5930538.html
相关阅读:
FunctionGraph无缝集成Express应用
 三分钟迁移Spring boot工程到Serverless
分布式数据库中间件使用经验分享
 基于OAS设计可扩展OpenAPI
从一次小哥哥与小姐姐的转账开始，浅谈分布式事务从理论到实践
 分布式数据库DDM Sidecar模式负载均衡
 Redis缓存数据库安全加固指导（二）
数据存储课后作业
 GrideVlew提供点击按钮添加新数据，单击项目修改，长按删除功能
 AutoCompleteTextView,Spinner,消息提示
原文地址：https://www.cnblogs.com/alex-13/p/14266541.html

命令行使用pip 安装python模块

2、Tesseract训练：