• linux tesseract 安装及部署tess4j项目的常见问题


    linux上部署tess4j项目

    在windows上项目是可以正常运行的,部署到Linux上后,运行报异常,异常内容为:Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract)

    这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件,windows是.dll文件)

    解决:

      将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下,问题解决,nice

    记录一下在Linux上部署tesseract

    ( 所需要的  Linux 安装包 tesseract-ocr-3.02.02.tar.gz及安装需要的leptonica-1.68.tar.gz  英文语言包 eng.traineddata.gz  戳链接:戳我

    1,编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)  
      yum install gcc gcc-c++ make

    2,autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:

        (1)yum install autoconf automake libtool

        (2)yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    3,安装 leptonica

      下载 leptonica-1.68.tar.gz

       tar-zxvf leptonica-1.68.tar.gz

      (1) 进入 leptonica-1.73文件夹内(cd 命令)
      (2) 执行下面command

      ./configure

      make

      make install

      ldconfig

       //----------------------------------------------------------------- 

      make的时候发现错误,提示

             pngio.c:119: error: ‘Z_DEFAULT_COMPRESSION’ undeclared here (not in a function)

         去wiki上搜了一把发现是 pngio.c这个文件有个BUG,在MAC下无法找到zlib1g包修改Leptionica/src/pngio.c在  #include "png.h"后插入一下代码即可。

      

    1 #ifdef HAVE_LIBZ  
    2 #include "zlib.h"  
    3 #endif  

       //-----------------------------------------------------------------

     

    4,安装 tesseract

      下载 tesseract-ocr-3.02.02.tar.gz

      (1) 进入 tesseract-ocr-3.02.02文件夹内(cd 命令)
      (2) 执行下面command

      ./autogen.sh

      ./configure

      make

      make install

      ldconfig

      如果需要在linux上运行带tess4j的项目,需要将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下

    5,安装语言包

      下载 eng.traineddata.gz (如果需要验证中文,就下载中文的语言包)

      tar -zxvf eng.traineddata.gz

      将 eng.traineddata文件 拷贝到  /usr/local/share/tessdata下 ,如果没有tessdata文件夹,就去tesseract的安装文件位置将目录下的tessdata拷贝到  /usr/local/share/
     
    6,执行命令 tesseract
     如果出现下图,就安装成功了
        

     7,到这,你就可以敲下面的代码验证图片中的文字了:

       命令: tesseract 图片名  输出文本名 -l eng

      

  • 相关阅读:
    SQL Server UPDATE JOIN
    visual studio 使用正则表达式实现代码批量查找和替换
    AngularJs
    Entity Framework Power Tools 执行数据库反向工程时报错....
    SVN-无法查看log,提示Want to go offline,时间显示1970问题
    windows server安装dotnet-sdk-2.2.108-win-x64.exe时报dll找不到
    いいい
    あああ
    datatable 行列转换
    .net生成随机验证码图片
  • 原文地址:https://www.cnblogs.com/cmyxn/p/7007932.html
Copyright © 2020-2023  润新知