• 利用图像识别技术解决非原生控件的定位问题


    缘起

    前天同桌妹纸问一个控件怎么定位的问题,我张口就来,ID,xpath。。。。。妹纸说这些我都试过了,还是无法定位,不信我Debug给你看。N种方法尝试后,只能接受现实,非原生控件,于是老脸一红,告诉妹纸,这是非原生控件,无法通过常规方式定位。搜索了一下,很多帖子都反映过这个问题,但是都没给出解决策略。不知道这些小伙伴最终有没有解决。遂决定,吃个大闸蟹,研究一下看能否解决。

    非原生控件给自动化带来的痛点

    • View里控件都定位不到
    • 控件随机变化(如支付密码键)
      密码键盘每次页面打开或者页面刷新键位都不一样

       
    • 常规定位方式无法识别
      智能货架,经常变换的显示位置

       

    常规解决方式

    • 坐标大法:但是坐标大法对于有些随机变化密码键就无法操作了。
    • 开发配合:给特定的app包,解除安全键盘。这种操作无异于饮鸩止渴。

    图像识别尝试

    由于我们页面控件不会像验证码那么多干扰难识别,现在图形识别技术Java,Python,C++等都非常成熟。一通百度后在OpenCV 发现了matchTemplate 方法,在图片中找指定的图片。主要用的以下两种方法:

    • 使用OpenCV函数 matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像
    • 使用OpenCV函数 minMaxLoc 在给定的矩阵中寻找最大和最小值(包括它们的位置).

    具体实现

    1. 截取图

      1. 滑动到非原生控件,使元素可见
      2. 截取截目画面即为原图像
      3. 用画图工具打开原图像(不要人为放大或者缩小原图像),截取非原生控件的图像即为模板图像
      4. 原图像:
         
      5. 如下用画图工具打开,保证分别率不变下截取目标图像作为模板图像
         
      6. 模板图像(非原生控件图像)
         
    2. 取坐标

      1. 执行OpenCV函数 matchTemplate获取坐标
      2. 为方便公司同事和社区伸手党使用,直接上码 LvmamaKit代码工程Git传送门,调用LvmamaKit.find2BElementPoint4Debug会在原图像上标识出是否匹配成功
      3. 第二步成功后,调用LvmamaKit.find2BElementPoint返回Json格式坐标
      4. 回显示意图,忽略图片失真
         
        5.返回坐标,自行计算出中心坐标 {"x":"309","y":"854","width":"105","height":"82"}
         
    3. 点坐标

      1. 拷贝返回的坐标,进行相对计算
      2. 点击相对坐标,完成你的自动化用例
    4. 识别密码
      1.密码键盘,1-9随机变,图像识别妥妥的搞定。 示意图

       
    5. 搞定收工

      1. 明天可以给妹子解决非原生控件的定位问题咯

    参考资料

    代码拷来总觉浅,绝知此事要躬行
  • 相关阅读:
    2.6.2.MySQL主从复制的原理
    2.4.5 MySQL InnoDB重做与回滚介绍
    PRML读书笔记_绪论曲线拟合部分
    python3_字符串
    PRML读书笔记_绪论
    python3_列表、元组、集合、字典
    linux_软件安装
    shell获取帮助
    linux_查看磁盘与目录容量
    linux_压缩解压命令(zip/tar)
  • 原文地址:https://www.cnblogs.com/yinxiaoqiexuxing/p/9845362.html
Copyright © 2020-2023  润新知