• 保存新浪微博授权登录验证码图片供机器学习 非机器学习方法的实现 近似度量化比较


    open('mypng.png','wb').write((requests.get(url)._content))


    HTTPSConnectionPool(host='login.sina.com.cn', port=443): Max retries exceeded with url: /cgi/pin.php?r=48137058&s=0&p=tc-e8d1b4ea6beb93e9c1f67504c40e2c59c10e (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x00000214EE586198>: Failed to establish a new connection: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。',))
    -----------------
    cnn/49167360sina_com_cn_cgi_pin.php.png
    cnn/80874485sina_com_cn_cgi_pin.php.png
    cnn/85921430sina_com_cn_cgi_pin.php.png
    cnn/57878857sina_com_cn_cgi_pin.php.png
    cnn/87437683sina_com_cn_cgi_pin.php.png
    cnn/42701834sina_com_cn_cgi_pin.php.png
    cnn/14463780sina_com_cn_cgi_pin.php.png
    cnn/41911142sina_com_cn_cgi_pin.php.png
    cnn/51278293sina_com_cn_cgi_pin.php.png
    cnn/89302902sina_com_cn_cgi_pin.php.png
    cnn/23213296sina_com_cn_cgi_pin.php.png
    HTTPSConnectionPool(host='login.sina.com.cn', port=443): Max retries exceeded with url: /cgi/pin.php?r=48137058&s=0&p=tc-e8d1b4ea6beb93e9c1f67504c40e2c59c10e (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x00000214EE550E10>: Failed to establish a new connection: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。',))
    -----------------
    cnn/82880039sina_com_cn_cgi_pin.php.png
    cnn/16721523sina_com_cn_cgi_pin.php.png
    cnn/29145537sina_com_cn_cgi_pin.php.png

    import random
    import requests
    from time import sleep

    useed_int_l = []
    url = 'https://login.sina.com.cn/cgi/pin.php?r=12341234&s=0&p=tc-e8d1b4ea6beb93e9c1f67504c40e2c59c10e'
    img_dir = 'cnn/'
    while True:
    i = random.randrange(10 ** 7, 10 ** 8)
    if i not in useed_int_l:
    s = str(i)
    url = url.replace('12341234', s)
    cnn = '%s%s%s' % (img_dir, s, 'sina_com_cn_cgi_pin.php.png')
    bytes = 0
    try:
    bytes = requests.get(url)._content
    except Exception as e:
    print(e)
    sleep(1)

    if bytes != 0:
    with open(cnn, 'wb')as f:
    f.write(bytes)
    print(cnn)
    else:
    print('-----------------')

    特征提取

    放大后观察,干扰曲线为实心线,而待识别字符为虚心




    可垂直于宽切割

    字体唯一,1-9-0a_zA_Z,只是旋转角度大致为-90-+90

    字符个数唯一,为5

    思路:

    切割出5个字符,在-90-+90间旋转,与标准字符做相似度比较,量化,取最近的为识别结果,不考虑干扰线的影响

  • 相关阅读:

    卖了5个月水果之后再看互联网思维
    实时流式计算框架Storm 0.9.0发布通知(中文版)
    Top100Summit全球案例研究峰会第一天总结——云计算和大数据
    [若有所悟]提升工作效率的一些小技巧——资源管理器篇
    [若有所悟]主持会议的八大戒条
    惊魂36小时,一次生产事故,动态磁盘删除卷分区丢失,数据恢复案例实战
    一个不用的域名到期导致整个服务器上其他网站都无法访问的线上事故
    guava cache大量的WARN日志的问题分析
    IDEA下运行 mybatis报错 Parameter 'arg0' not found. Available parameters are [autoRecharge, id, param1, param2]
  • 原文地址:https://www.cnblogs.com/rsapaper/p/8193447.html
Copyright © 2020-2023  润新知