http://www.cnblogs.com/Jaypei/archive/2009/09/16/1567629.html
http://code.google.com/p/tesseract-ocr/downloads/list
看官方介绍主要是VS2008编译,其实VS2005下使用也很简单,没有成功的可以尝试我的方法。
编译
首先下载2.04版本解压缩到某一目录(假设X:\jaypei\tesseract-2.04)。打开“tesseract.dsw”文件,而不是sln文件,在提示中一路点“否”,点几个过后就看到工程目录树了。
在tessdll的属性中选择“配置属性->C++->常规->输出目录”加上目录“ccmain”。
在dlltest的属性中选择“配置属性->连接器->输出->附加依赖库”,把内容改成“../bin.dbg6/tessdll.lib”。
最后点击“生成解决方案”即可。
使用
新建一个项目,在项目中加入如下目录(属性->配置属性->C/C++->常规->附加包含目录):
X:\jaypei\tesseract-2.04
X:\jaypei\tesseract-2.04\aspirin
X:\jaypei\tesseract-2.04\ccutil
X:\jaypei\tesseract-2.04\ccstruct
X:\jaypei\tesseract-2.04\classify
X:\jaypei\tesseract-2.04\cutil
X:\jaypei\tesseract-2.04\dict
X:\jaypei\tesseract-2.04\display
X:\jaypei\tesseract-2.04\image
X:\jaypei\tesseract-2.04\textord
X:\jaypei\tesseract-2.04\viewer
X:\jaypei\tesseract-2.04\wordrec
X:\jaypei\tesseract-2.04\ccmain
然后新建筛选器“ccutil”和“image”,包含如下文件:
+ccutil
clst.cpp
debugwin.cpp
errcode.cpp
globaloc.cpp
hashfn.cpp
memblk.cpp
memry.cpp
serialis.cpp
strngs.cpp
tprintf.cpp
unichar.cpp
varable.cpp
+image
bitstrm.cpp
imgbmp.cpp
imgio.cpp
imgs.cpp
imgtiff.cpp
加入预处理定义“__MSW32__”(属性->配置属性->C/C++->预处理器->预处理定义)。
在运行目录下创建文件夹tessdata,下载最新的unichar文件“tesseract-2.00.eng.tar.gz”,解压缩到tessdata中。新建文件tessdata/configs/api_config,在里面写入如下内容:
tessedit_zero_rejection T
当然,还有很多可选项,这里不一一列举,具体查阅文档或源码。
以上几步做完后就可以顺利的在自己项目中使用tesseract了,具体的使用代码可以参照dlltest,这里不做介绍。