• 登录页面图片验证码获取(OCR)


    百度OCR网站地址:https://ai.baidu.com,新建图文识别产品,拿到对应的appid、appkey、secretkey

    ocr提供了模板,可以直接复制

    安装三方库

    pip install baidu-aip

    pip install pillow

    from selenium import webdriver
    import time
    from PIL import Image
    from aip import AipOcr
    from os import path
    
    class login():
    
        def get_code(self, browser):
            # (3)获取图片验证码坐标
            code_ele = browser.find_element_by_xpath("//img[@id='captcha']")
            print("验证码的坐标为:", code_ele.location)#控制台查看{'x': 1086, 'y': 368}
            print("验证码的大小为:", code_ele.size)# 图片大小{'height': 40, 'width': 110}
            # (4)图片4个点的坐标位置
            left = code_ele.location['x']#x点的坐标
            top = code_ele.location['y']#y点的坐标
            right = code_ele.size['width']+left#上面右边点的坐标
            down = code_ele.size['height']+top#下面右边点的坐标
            image = Image.open('D:/pic.png')
            # (4)将图片验证码截取
            code_image = image.crop((left, top, right, down))
            code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件
    
    
        def baiduOCR(self, picfile, outfile):  # picfile:图片文件名 outfile:输出文件
            filename = path.basename(picfile)  # 图片名称
            # 百度提供
            """ 你的 APPID AK SK """
            APP_ID = '23054650'  # 这是你产品服务的appid
            API_KEY = 'kEKxwQx9TEOWCKflaG4CXR2C'  # 这是你产品服务的appkey
            SECRET_KEY = 'AxzVIi56TIn8zliGDekGc735029fUTlP'  # 这是你产品服务的secretkey
            client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
            i = open(picfile, 'rb')
            img = i.read()
    
            print("正在识别图片:	" + filename)
            """ 调用通用文字识别(高精度版) """
            message = client.basicAccurate(img)
            print("识别成功!")
            i.close()
            # with open(outfile, 'a+') as fo:  # 这边是写进.txt文件
            #     fo.writelines("*" * 60 + '
    ')  # 搞点花里胡哨的做区分
            #     fo.writelines("识别图片:	" + filename + "
    " * 2)
            #     fo.writelines("文本内容:
    ")
            #     # 输出文本内容
            #     for text in message.get('words_result'):  # 识别的内容
            #         fo.writelines(text.get('words') + '
    ')
            #     fo.writelines('
    ' * 2)
            # print("文本导出成功!")
            print()
    
            # 将每行文字拼接成一个整体
            string_text = ""
            for text in message.get('words_result'):
                string_text += text.get('words')
            print('string_text:', string_text)
            return string_text
    
    
    if __name__ == '__main__':
        l = login()
        base_url = 'http://xxxxxxxxx'
        browser = webdriver.Chrome()
        browser.maximize_window()   # 最大化视图
        browser.implicitly_wait(10)  
        browser.get(base_url)
        time.sleep(5)
        # (1)登录页面截图
        browser.save_screenshot("D:/pic.png")  # 可以修改保存地址
        # (2)基操
        browser.find_element_by_name("username").send_keys("admin")
        browser.find_element_by_name("password").send_keys("123456")
        time.sleep(2)
    
        l.get_code(browser)
    
        outfile = 'D:/export1.txt'  # 保存的文件
        string_text = l.baiduOCR('D:/pic1.png', outfile)
        # print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)
    
        browser.find_element_by_name("captcha").send_keys(string_text)
    
        browser.find_element_by_xpath('//*[@id="submit"]').click()
  • 相关阅读:
    inotify和rsync实现数据实时同步
    Powershell在相应的文件夹下用管理员模式打开
    LOJ6498「雅礼集训 2018 Day2」农民
    LOJ6502「雅礼集训 2018 Day4」Divide
    LOJ6501「雅礼集训 2018 Day4」Cube
    2021-10-11 杂题选听
    LOJ6507 「雅礼集训 2018 Day7」A
    LOJ6497「雅礼集训 2018 Day1」图
    CF103E Buying Sets
    CF266D BerDonalds(图的绝对中心)
  • 原文地址:https://www.cnblogs.com/suancaipaofan/p/14062096.html
Copyright © 2020-2023  润新知