突然发现好久没有写过博客了,不知曾经几时申请了这个园了,也不曾经几时来过一次...
就在前不久 编写一次网络爬虫程式中验证码功能 让我头痛了几天 如今破解了 虽不是最优的方法 但适合通用方法,废话就不多说了
现将本人研究思路分享给大家,希望大家给出建议和批评 谢谢 ....
https://e-commerce.chinalife.com.tw/online/common/image.jsp
一.首先分析验证码的特点 是我们破解其关键.
我们发现 其验证码除字码外还有部分干扰线组成,并且干扰线与字码颜色一致,瞬间想死的心都有了 怎么办,怎么才能让其分开呢,
哈哈不要怕 我相信你能行了哦
二.不但的要给自己打气 ,不但提醒自己 ,我能行
没有什么问题能难住我们的,只有我们放弃寻找解决问题的办法 ,废话不多说了 开始分析 寻找不同点吧!
仔细观察我们发现 字码与干扰线的像素点 不一样 , 并且他们之间像素分部密度不一样 ,这就是我们的突破口哦
三.去掉干扰线,噪点,得到干头净的字码
四.切图 得到我们想要的字码部分
五.将图片进行二值化 存入资料库
六.使用LevenshteinDistance求临进值
结果如下
以上网站仅供学习参考,请读者不要客意破坏他人网站,若造成非法行为,后果自负..