• 【Linux】- centos部署tesseract


    安装相关依赖

    sudo yum install autoconf automake  

    sudo yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    安装leptonica-1.72

    wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

    tar -xvf leptonica-1.72.tar.gz

    cd leptonica-1.72

    执行配置指令 ./configure 

    执行编译指令 make

    执行安装指令 sudo make install 

    至此,leptonica安装完毕

    安装tesseract

    wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

    如不能正常下载,可以网盘下载

    https://pan.baidu.com/s/1mj6YTIw  

    提取码是:95p5

    解压指令 tar xzvf 3.04.00.tar.gz

    cd tesseract-3.04.00

    分别执行以下指令:

    sudo ./autogen.sh

    执行配置指令 ./configure

    执行编译指令 make

    执行安装指令 sudo make install 

    执行指令 sudo ldconfig

    这一步安装可能存在的问题较多,记录如下:

    错误1:

    缺少包,

    执行指令:sudo yum install gcc-c++ 

    然后在重新执行 ./configure

    错误2:

    make: Nothing to be done for `all' 

    解决:

    make clean 清除安装时留下的文件

    在运行一下sudo ldconfig

    在重新执行安装tesseract 步骤

    错误3:

    make[2]: Nothing to be done for `install-exec-am'.
    make[2]: Nothing to be done for `install-data-am'.

    解决:

    make clean 清除安装时留下的文件

    在运行一下sudo ldconfig

    重新执行安装tesseract 步骤,其中./configure  改为./configure --prefix=/usr

    错误4:

    make[1]: *** [install-bfd] Error 2
    make[1]: Leaving directory `/usr/local/gdb-7.10'

    解决:

    ./configure --prefix=/usr/local/gdb #不要和gdb-version源码相同目录即可。

    错误5:

    ldconfig: Can't create temporary cache file /etc/ld.so.cache~: Permission denied

    解决:

    export LD_LIBRARY_PATH=/usr/local/lib

    下载字体

    下载安装英文,中文繁体,中文简体 识别库
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
    wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
    如不能下载,请参考上面网盘地址进行下载

    将刚刚的文件拷贝到tessdata文件夹下:

    sudo cp chi_sim.traineddata /usr/local/share/tessdata
    sudo cp eng.traineddata /usr/local/share/tessdata
    sudo cp eng.traineddata.part /usr/local/share/tessdata

    测试

    查看版本  tesseract --version

    cd tesseract-3.04.00

    cd testing

    执行  tesseract phototest.tif result -l eng

     

    再查看testing目录下的文件,发现多了一个result.txt:

    打开 cat result.txt

    参考:

    1、https://blog.csdn.net/wanght89/article/details/78329546

    2、https://blog.csdn.net/nsnv_hunter/article/details/79414752

    3、https://blog.csdn.net/pangyunsheng/article/details/79372845

  • 相关阅读:
    一致性hash算法
    Mapreduce部署与第三方依赖包管理
    windows10下使用spark-2.3.0-bin-without-hadoop相关问题
    VirtualBox mount报错:/sbin/mount.vboxsf: mounting failed with the error: No such device
    如何重命名MongoDB中的replica set
    MongoDB开发环境Replica Set单机部署流程
    MongoDB修改Replica Set的服务器名和端口
    Axios -- Ajax请求
    element中的table表格显示时间格式问题
    java 常用工具类
  • 原文地址:https://www.cnblogs.com/zheng1076/p/10869293.html
Copyright © 2020-2023  润新知