利用图像识别技术解决非原生控件的定位问题

利用图像识别技术解决非原生控件的定位问题
缘起

前天同桌妹纸问一个控件怎么定位的问题，我张口就来，ID，xpath。。。。。妹纸说这些我都试过了，还是无法定位,不信我Debug给你看。N种方法尝试后，只能接受现实，非原生控件，于是老脸一红，告诉妹纸，这是非原生控件，无法通过常规方式定位。搜索了一下，很多帖子都反映过这个问题，但是都没给出解决策略。不知道这些小伙伴最终有没有解决。遂决定，吃个大闸蟹，研究一下看能否解决。

非原生控件给自动化带来的痛点
- View里控件都定位不到
- 控件随机变化（如支付密码键）
  密码键盘每次页面打开或者页面刷新键位都不一样
- 常规定位方式无法识别
  智能货架，经常变换的显示位置
常规解决方式
- 坐标大法：但是坐标大法对于有些随机变化密码键就无法操作了。
- 开发配合：给特定的app包，解除安全键盘。这种操作无异于饮鸩止渴。
图像识别尝试

由于我们页面控件不会像验证码那么多干扰难识别，现在图形识别技术Java，Python，C++等都非常成熟。一通百度后在OpenCV 发现了matchTemplate 方法，在图片中找指定的图片。主要用的以下两种方法：
- 使用OpenCV函数 matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像
- 使用OpenCV函数 minMaxLoc 在给定的矩阵中寻找最大和最小值(包括它们的位置).
具体实现
1. 截取图
  1. 滑动到非原生控件，使元素可见
  2. 截取截目画面即为原图像
  3. 用画图工具打开原图像（不要人为放大或者缩小原图像），截取非原生控件的图像即为模板图像
  4. 原图像：
  5. 如下用画图工具打开，保证分别率不变下截取目标图像作为模板图像
  6. 模板图像（非原生控件图像）
2. 取坐标
  1. 执行OpenCV函数 matchTemplate获取坐标
  2. 为方便公司同事和社区伸手党使用，直接上码 LvmamaKit代码工程Git传送门，调用LvmamaKit.find2BElementPoint4Debug会在原图像上标识出是否匹配成功
  3. 第二步成功后，调用LvmamaKit.find2BElementPoint返回Json格式坐标
  4. 回显示意图，忽略图片失真
    
    5.返回坐标，自行计算出中心坐标 {"x":"309","y":"854","width":"105","height":"82"}
3. 点坐标
  1. 拷贝返回的坐标，进行相对计算
  2. 点击相对坐标，完成你的自动化用例
4. 识别密码
  1.密码键盘，1-9随机变，图像识别妥妥的搞定。示意图
5. 搞定收工
  1. 明天可以给妹子解决非原生控件的定位问题咯
参考资料
代码拷来总觉浅，绝知此事要躬行
相关阅读:
LightOJ
LightOJ
51Nod 1021~1023 石子合并（逐步加强版）【dp】
BZOJ1036 [ZJOI2008]树的统计Count 【树链剖分+线段树维护】
51Nod 1677 treecnt 【树形dp+组合数学+逆元】
逆元【数学】
51Nod 1705七星剑【概率dp】
BZOJ 1064 [Noi2008]假面舞会【bfs】
51 nod 1443 路径和树【最短路径】
BZOJ 1013 [JSOI2008]球形空间产生器sphere 【高斯消元】
原文地址：https://www.cnblogs.com/yinxiaoqiexuxing/p/9845362.html

最新文章
pat 1137
pat 1139
Django form表单
 AJAX
Django的中间件
 Cookie和Session
Django之ORM操作
 Django之ORM
Django之路由系统
 Django安装

热门文章
WEB框架原理(socket)
数据库笔记
 HDU
CodeForces
LightOJ
LightOJ
LightOJ
LightOJ
LightOJ
LightOJ

利用图像识别技术解决非原生控件的定位问题

缘起

非原生控件给自动化带来的痛点

常规解决方式

图像识别尝试

具体实现

参考资料