使用Tesseract (OCR)实现简单的验证码识别(C#)+窗体淡入淡出效果 - 人生过处惟有悔 - 博客园
使用Tesseract (OCR)实现简单的验证码识别(C#)+窗体淡入淡出效果
来园子也有一段时间了,一直没时间写点东西,说实话刚开始也不知道写什么,一直以来对验证码识别比较感兴趣,曾经想着自己处理图形实现识别验证码,不过感觉对我来说太难了,偶然中再网上发现了Tesseract,于是就想借助Tesseract 来实现简单验证码的识别,正好今天周末有时间写了这点东西。
1、Tesseract介绍:
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
2、下载Tesseract:
http://code.google.com/p/tesseract-ocr/downloads/list,可以到这里下载一些识别必须的文件。
3、编写代码:
Tesseract可以在命令行中运行,但觉得不太好用,于是就通过代码调用DOS命令实现图像识别
1 using System.Diagnostics;