CogOCRMaxTool工具的功能原理
CogOCRMaxTool是字符读取工具,能够根据已训练的字符样本读取灰度图像中的字符,并返回读取结果。在使用COgOCRMaxtool工具读取字符的时候,需要设置字符区域,每个字符的最大最小宽度等参数。在字符读取之前需要首先进行字符分割和字符训练,下面分别进行介绍:
1) 字符分割:
字符分割的过程就是将字符像素从背景像素中分离出来,然后将这些分离后的字符像素分割成独立的符号,CogOCRMaxTool工具支持一套参数,这些参数指示如何把字符和背景以及字符和字符分割开,这些参数的设置需要考虑多种因素,如字符之间的距离、字符的种类、图像的质量等,通常情况下,默认的分割参数不能将字符充分分割。需要不断的尝试着修改分割参数,直到字符能够充分分割。
2) 字符分类
字符分类的过程就是为每一个分割的字符训练一个最佳匹配字符。新添加CogOCRMaxTool工具是没有训练字符的。可以从文件中调用已经存在的字符文件或临时添加字符集,添加字符集是一个不断重复的过程,需要添加所有需要读取的字符,只有在训练字符集中存在的字符才能够被成功读取。对于未训练的字符则不能成功读取。