登录页面图片验证码获取（OCR）

百度OCR网站地址：https://ai.baidu.com，新建图文识别产品，拿到对应的appid、appkey、secretkey

ocr提供了模板，可以直接复制

安装三方库

pip install baidu-aip

pip install pillow

from selenium import webdriver
import time
from PIL import Image
from aip import AipOcr
from os import path

class login():

    def get_code(self, browser):
        # (3)获取图片验证码坐标
        code_ele = browser.find_element_by_xpath("//img[@id='captcha']")
        print("验证码的坐标为：", code_ele.location)#控制台查看{'x': 1086, 'y': 368}
        print("验证码的大小为：", code_ele.size)# 图片大小{'height': 40, 'width': 110}
        # (4)图片4个点的坐标位置
        left = code_ele.location['x']#x点的坐标
        top = code_ele.location['y']#y点的坐标
        right = code_ele.size['width']+left#上面右边点的坐标
        down = code_ele.size['height']+top#下面右边点的坐标
        image = Image.open('D:/pic.png')
        # (4)将图片验证码截取
        code_image = image.crop((left, top, right, down))
        code_image.save('D:/pic1.png')#截取的验证码图片保存为新的文件


    def baiduOCR(self, picfile, outfile):  # picfile:图片文件名 outfile:输出文件
        filename = path.basename(picfile)  # 图片名称
        # 百度提供
        """ 你的 APPID AK SK """
        APP_ID = '23054650'  # 这是你产品服务的appid
        API_KEY = 'kEKxwQx9TEOWCKflaG4CXR2C'  # 这是你产品服务的appkey
        SECRET_KEY = 'AxzVIi56TIn8zliGDekGc735029fUTlP'  # 这是你产品服务的secretkey
        client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
        i = open(picfile, 'rb')
        img = i.read()

        print("正在识别图片：	" + filename)
        """ 调用通用文字识别（高精度版） """
        message = client.basicAccurate(img)
        print("识别成功！")
        i.close()
        # with open(outfile, 'a+') as fo:  # 这边是写进.txt文件
        #     fo.writelines("*" * 60 + '
')  # 搞点花里胡哨的做区分
        #     fo.writelines("识别图片：	" + filename + "
" * 2)
        #     fo.writelines("文本内容：
")
        #     # 输出文本内容
        #     for text in message.get('words_result'):  # 识别的内容
        #         fo.writelines(text.get('words') + '
')
        #     fo.writelines('
' * 2)
        # print("文本导出成功！")
        print()

        # 将每行文字拼接成一个整体
        string_text = ""
        for text in message.get('words_result'):
            string_text += text.get('words')
        print('string_text:', string_text)
        return string_text


if __name__ == '__main__':
    l = login()
    base_url = 'http://xxxxxxxxx'
    browser = webdriver.Chrome()
    browser.maximize_window()   # 最大化视图
    browser.implicitly_wait(10)  
    browser.get(base_url)
    time.sleep(5)
    # (1)登录页面截图
    browser.save_screenshot("D:/pic.png")  # 可以修改保存地址
    # (2)基操
    browser.find_element_by_name("username").send_keys("admin")
    browser.find_element_by_name("password").send_keys("123456")
    time.sleep(2)

    l.get_code(browser)

    outfile = 'D:/export1.txt'  # 保存的文件
    string_text = l.baiduOCR('D:/pic1.png', outfile)
    # print('图片文本提取结束！文本输出结果位于 %s 文件中。' % outfile)

    browser.find_element_by_name("captcha").send_keys(string_text)

    browser.find_element_by_xpath('//*[@id="submit"]').click()

相关阅读:
inotify和rsync实现数据实时同步
 Powershell在相应的文件夹下用管理员模式打开
 LOJ6498「雅礼集训 2018 Day2」农民
 LOJ6502「雅礼集训 2018 Day4」Divide
LOJ6501「雅礼集训 2018 Day4」Cube
2021-10-11 杂题选听
 LOJ6507 「雅礼集训 2018 Day7」A
LOJ6497「雅礼集训 2018 Day1」图
 CF103E Buying Sets
CF266D BerDonalds（图的绝对中心）
原文地址：https://www.cnblogs.com/suancaipaofan/p/14062096.html