提高OCR质量,除了可以使用ABBYY FineReader 12OCR文字识别软件解决纸质文档的复杂结构未出现在电子文档中,或者未正确检测到区域的问题(详见如何提高ABBYY FineReader OCR的质量),ABBYY FineReader还能利用模式功能提高OCR的质量,这个细节你可能一直忽略了吧。
1、打开ABBYY FineReader 12,在工具菜单中,点击‘模式编辑器’。
2、在‘模式编辑器’对话框中,从可用模式列表中选择所需模式,然后点击‘设置为活动’。
注意:
1、ABBYY FineReader 12无法区分一些相似但又不同的字符,而是将它们识别为相同的字符。例如,直引号 (')、左引号 (‘) 和右引号 (’) 在模式中都将存储为一个字符(直引号)。这意味着即使您尝试对左引号和右引号进行训练,它们还是不会用在已识别的文本中。
2、对于某些字符图像,ABBYY FineReader 12将视上下文内容来选择相应的键盘字符。例如,对于小圈图像,如果其周围为字母,它将被识别为字母O,而如果紧挨着其周围的为数字,则会被识别为数字0。
3、仅当文档具有与创建模式的文档相同的字体、字号和分辨率时,方可对该文档使用此模式。
4、要识别以不同字体设置的文本,请选择“仅使用内置模式”选项(在工具 > 选项 > 读取中)。