• python 验证码识别初探


    使用 pytesser 与 pytesseract 识别验证码

     前置 : 

    首先需要安装  tesserract

    tesserract windows 安装包及中文
     
    安装好之后,建议将中文资源包放到下面目录下

    是否要进行如下操作,我忘了,这段修改参考最下面的引用。
    
    
    2,安装完成tesseract-ocr后,我们还需要做一下配置 
    在C:UsershuxiuAppDataLocalProgramsPythonPython35Libsite-packagespytesseract找到pytesseract.py打开后做如下操作
    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
    #tesseract_cmd = 'tesseract'
    tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

    方式1 : 

      pytesseract  环境 anaconda 3.x  IED : pycharm 5.0

    pip install PIL 
    pip install pytesseract

      python 代码:

    # encoding : utf=8
    
    from PIL import Image
    import pytesseract
    
    print(pytesseract.image_to_string(Image.open('04.jpeg')))

    结果:

    原图:

    但是在识别.png图片是却有问题了 ...

    比较尴尬....    有可能是字体有缘故

    方式2:  pytesser  处理

    这个对比较复杂  ..

      1,从官网下载文件 https://code.google.com/archive/p/pytesser/downloads       (pytesser_v0.0.1.zip

      2,解压重命名文件夹 pytesser 到  python 2.* 版本的  Libsite-packages 下,我的是("C:ProgramDataAnaconda3envspython 2.7Libsite-packagespytesser") ,并将 “C:ProgramDataAnaconda3envspython 2.7Libsite-packages” 手动加入到环境变量中。

        “这里要注意,Anaconda3 默认的是 python 3.6 ,需要在 IDE pycharm  中,创建anacoda python 2.7 的环境”  

         

        创建完的虚拟环境,相关包需要重新安装,在下面搜索,不能用pip install ** 安装

        

        上python代码:

        

    # encoding : utf-8
    
    
    from PIL import Image
    from pytesser import *
    
    image = Image.open("02.png")
    print image_to_string(image)

        运行要用IDE 的 config来选择环境运行..

        

        结果:

        

        还是把 上面的那个 6886 识别成 了 5885 

        

     参考文档:https://blog.csdn.net/qiushi_1990/article/details/78041375

  • 相关阅读:
    a标签中调用js的几种方法
    IE11浏览器:请不要再叫我IE,谢谢
    IE11浏览器:请不要再叫我IE,谢谢
    浅谈href=#与href=javascript:void(0)的区别
    浅谈href=#与href=javascript:void(0)的区别
    Google Java编程风格指南
    Google Java编程风格指南
    Git学习小结 ~ Lethe's Blog
    Binder机制简析(三)
    Ness
  • 原文地址:https://www.cnblogs.com/jackicalSong/p/9235216.html
Copyright © 2020-2023  润新知