• 有关python下二维码识别用法及识别率对比分析


     最近项目中用到二维码图片识别,在python下二维码识别,目前主要有三个模块:zbar 、zbarlight、zxing。

    1、三个模块的用法:

    #-*-coding=utf-8-*-
    import os 
    import logging
    import zbar 
    from PIL import Image 
    import zxing
    import random
    import zbarlight
    
    logger=logging.getLogger(__name__)
    if not logger.handlers :logging.basicConfig(level=logging.INFO)
    DEBUG= (logging.getLevelName(logger.getEffectiveLevel())=='DEBUG')  
    
    
    def ocr_qrcode_zbar(filename):
        img=Image.open(filename)
        width, height = img.size
        raw = img.tobytes()
        
        scanner = zbar.ImageScanner()
        scanner.parse_config('enable')        
        #把图像装换成数据
        zarimage = zbar.Image(width, height, 'Y800', raw)    
        #扫描器进行扫描
        scanner.scan(zarimage)
        
        data = '' 
        for symbol in zarimage:
            # 对结果进行一些有用的处理
            data += symbol.data 
        if data:
            logger.debug(u'识别二维码:%s,内容: %s' %(filename ,data))
        else:
            logger.error(u'识别zbar二维码出错:%s' %(filename))
            img.save('%s-zbar.jpg' %filename)  
        return data 
    
    def ocr_qrcode_zbarlight(filename):
        img=Image.open(filename)
    
        width, height = img.size
        raw = img.tobytes()
            
        #把图像装换成数据
        data = zbarlight.qr_code_scanner(raw, width, height)    
    
        if data:
            logger.debug(u'识别二维码:%s,内容: %s' %(filename ,data))
        else:
            logger.error(u'识别zbarlight二维码出错:%s' %(filename))
            img.save('%s-zbar.jpg' %filename)  
        return data 
    
    def ocr_qrcode_zxing(filename):
        #在当前目录生成临时文件,规避java的路径问题
        img= Image.open(filename)
        ran= int(random.random()*100000)
        img.save('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
        zx = zxing.BarCodeReader()
        data =''
        zxdata = zx.decode('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
        #删除临时文件
        os.remove('%s%s.jpg' %(os.path.basename(filename).split('.')[0],ran))
        if zxdata:
            logger.debug(u'zxing识别二维码:%s,内容: %s' %(filename ,zxdata.data))
            data = zxdata.data
        else:
            logger.error(u'识别zxing二维码出错:%s' %(filename))
            img.save('%s-zxing.jpg' %filename)  
        return data
    
        
    if __name__ == '__main__': 
        filename =r'D:python0025328.jpg'
     
        #zbar二维码识别
        ltext = ocr_qrcode_zbar(filename)
        logger.info( u'[%s]Zbar二维码识别:[%s]!!!' %(filename,ltext))
        print ltext
        
        #zbarlight二维码识别
        ltext = ocr_qrcode_zbarlight(filename)
        logger.info( u'[%s]Zxing二维码识别:[%s]!!!' %(filename,ltext))
        print ltext 
    
        #zxing二维码识别
        ltext = ocr_qrcode_zxing(filename)
        logger.info( u'[%s]Zxing二维码识别:[%s]!!!' %(filename,ltext))
        print ltext

     

    2、使用对比

    1、zbar和zbarlight内核一致,都是基于zbar的dll编译加载的。

    2、zbarlight使用比zbar更简单,不过是在zbar的基础又做了一点点封装而已。

    3、zxing是基于java的zxing核心的python分支,其原理是调用javaw 加载zxing的core.jar包,再获取输出结果。

    zxing的调试是一个大坑,网上的资料都存在这样那样的信息过时问题,加上zxing对java的依赖问题更多,这篇博客 http://www.cnblogs.com/oucsheep/p/6269813.html 相对来说比较清晰,但是估计初学者看起来会比较累。

    3、总结:

    1、项目的图片来源于是纸质文件的扫描件(qrcode),实际情况相对复杂,存在打印偏移,与其他文字重叠、图片变形、色带缺墨导致图片残缺等多种可能性。虽然经过一系列的图片处理,但目前来看三个包在容错性都不算太好。

    2、但是,但是…… 微信中的“扫一扫”,却可以做到正常识别,应该是微信的二维码识别是有自己的独到算法,遗憾微信没有开放接口,也没有查到相关资料。

    3、支付宝的"扫一扫",识别率略次于微信,但是也比开源的几个包要强的多。

    4、网上有一些付费api,识别率也一般,怀疑也是基于zxing和zbar的二次封装。

    5、三流无名厂家的二维码扫描头硬件,直接扫描该纸质文件,识别率基本可以做到90%以上,当然这不排除是扫描转换时产生的信息丢失这个重要因素

    综上,以识别能力排序,硬件>微信>支付宝>zxing>zbarlight(zbar)。

    软件算法以微信最高,但比起硬件还是有差距,期待高手破解或者剥离微信的算法,也欢迎商用api开发者进行交流(可以付费),联系QQ 16906913 ,谢谢。

    以上……

  • 相关阅读:
    301重定向的代码
    小问题,小细节要注意(string类型转换为bool类型)
    关于添加网站适配的问题解决
    this.Page.Request.ServerVariables
    将一个字段的两个数据分开读取
    使用distinct出现的一个问题
    什么是集合是只读的?
    编辑完这一条数据如何继续转入下一条数据(快速编辑)
    系统信息相关命令
    用户权限相关命令
  • 原文地址:https://www.cnblogs.com/zhongtang/p/7148375.html
Copyright © 2020-2023  润新知