转载地址:http://blog.sina.com.cn/s/blog_548c0f960102vt53.html
1、ABBYY FineReader
简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多打印机、扫描仪都自带它为ocr软件。安装程序约300MB,选择词库安装后约500MB。
评价:功能齐全,众多软件中应该是第一。
缺点:占cpu/内存大。有时会识别出一些不存在的字(和正确的字很相像,但不存在。造字?)
简介: 功能类似汉王屏幕摘抄、Mini Ocr是专门OCR识别屏幕截图用的。
2、I.R.I.S. Readiris
Readiris Corporate(光学识别软件) v15.1.0 中文免费版
简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多印机、扫描仪都自带它为ocr软件。安装程序约200MB,选择词库安装后约100MB。
评价:功能可以,对表格的识别率ms比ABBYY FineReader高。没遇到FineReader的造字问题。
缺点:没自带校对功能。
友情提醒:
一定用Asian版,没写Asian的不支持中文!
导入图片时勾上“使用300dpi分辨率” 不然若图片不达标会弹出提示叫你从扫。
3、Scansoft Nuance
简介:国外4大OCR公司之一,自己号称全球都在用(估计没算中国),微软、清华还向他买技术
*** OmniPage (最贵的,$499.99 )
*** PaperPort (才$79.99 )
*** TextBridge (才$79.99 )
友情提醒+评价缺点:吹的多nb。下一个MULTi LANGUAGE多语言版,500MB,吓一跳。打开后发现带2个软件OmniPage和PDFCreate5。我们当然装最贵的OmniPage咯,实际安装程序越越约300MB。选择安装后250MB,kao,中文词库只不过是做样子呢!难怪微软也同时向清华买OCR技术。
4、清华文通TH-OCR
简介:国产(清华+文通)+国外企业Scansoft Nuance,值得支持,与汉王不同的是清华国际知名度比较好。微软向他买技术,满多印机、扫描仪也带它为ocr软件。
评价:功能还可以,(可以把汉王认为是国内的FineReader ,清华则是Readiris....或者反过来?) 嗯nb!还带语音效稿!
缺点:不支持多页单TIF文档
友情提醒:"清华紫光OCR"是旧版
*** 文通慧视小灵鼠
简介:简单的说就是增加了手写识别的增强版。
*** CAJViewer
简介:向清华买的识别程序。
*** 《文档天地》综合管理与处理系统
简介:向清华买的技术。
*** netocr.net在线OCR
简介:
应用了由清华大学电子系研制的国际领先的最新OCR识别技术,提供一天之内不超过99幅图像的免费的文字识别服务。
还有后台人工校对识别。。。
由文通搞的,貌似搞不下去了。
6、Microsoft微软
简介:微软,nb公司啊!开玩笑,其实用清华(中文?)和Scansoft Nuance(英文?)的引擎。
Office Document Imaging
Office OneNote
评价:用的像是清华早期的特征库。比较好笑的是,网上有人测试的比清华现在的词库识别好。
缺点:懒着写
友情提醒:
默认装了跟Office的相同语言的特征库,其他语言特征库手动添加,若装office多语言版ms就免了.
***老马的 UnicornViewer 、 Pdg2Pic 、 TextForever
简介:套用微软yy过的OCR引擎和词库来实现批量OCR
http://www.comicer.com/stronghorse/w...e/pdg2text.htm
*** 创华OCR
简介:套用微软yy过的OCR引擎和词库
7、Adobe Acrobat Pro
简介:Adobe,nb公司啊!开玩笑,其实是买IRIS Readiris的技术。
评价:
其实他的OCR技术也是给图片式PDF用的,识别后会在图片PDF的文字上附上识别文字,这样你可以拷贝pdf上的东西.
(表达能力有限,类似onenote的使用方法)
缺点:没自带校对功能。
友情提醒:不是免费的Reader,是Acrobat Pro或Acrobat Pro Extended版
8、Mini Ocr
简介:作者马飞涛知道是谁不?是护花使者的作者。用他的话说:
我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能
把文字识别出来,图像的含义就很容易让计算机理解了。
是的,专门设计给截图用的
评价:看看过滤效果,就知道多利害了吧,而且是他自制的特征库.
缺点:可惜无法手动选择识别区域
友情提醒:有点类似汉王屏幕摘抄、汉王照片摘抄
9、文粹OCR
简介:国产企业,值得支持。识别率不比汉王差!
缺点:功能不够强大、完善。
友情提醒:
去worldrobot.net/download.html 下最新2009版。华军,天空的都不是最新版。
默认快捷方式“文粹OCR”是update.exe,为避免每次升级,把路径改成WencuiOcr.exe。
*** 文粹在线OCR
貌似搞不下去了。
10、Newsoft 丹青文件辨识系统 MaxReader、Presto OCR
简介:应该是tw的Newsoft公司和国外Presto合搞的(这不重要)。
这Presto公司在9x年代买了ABBYY的识别引擎,然后丹青又买/合作/使用了Presto版的ABBYY识别引擎。(10年前旧版的ABBYY不支持中文,所以有的搞,不过现在。。。。)
评价:看他网上上吹的多nb(10年前的技术也敢吹?!),但是识别繁体竖排或简体都不见得有多好。安装程序越越约300MB,安装后130MB。
缺点:懒着写
友情提醒:我情愿用汉王,这不过是个旧版的ABBYY
11、汉王
简介:国产企业,值得支持
缺点:不支持多页单TIF文档
*** 汉王文本王文豪7600
评价:功能满全的,自带的几个小工具不错(汉王拼图精灵、汉王屏幕摘抄、汉王照片摘抄)
友情提醒:
1.貌似该公司目前开发重点是硬件,2007后出了文本王文豪7600就没更新了。
2.网上一个366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 这两个文件夹,大家装hwdocsafe 文件夹里的。另166MB的是光光hwdocsafe 这个文件夹。
3.设置里选“忽略段内回车换行”。
4.汉王屏幕摘抄、汉王照片摘抄貌似是用特征库,效果跟Mini Ocr一样。所以识别结果跟文本王不一样。
*** 汉王 PDF OCR
简介: 停止开发文本王但是品牌名声和功能还是要维护的。这个免费使用的才40MB。
评价: 什么PDF OCR啊?我的一个图像pdf就根本识别不了....
*** 汉王尚书七号
简介:尚书OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约60MB.
*** Founder 方正OCR
简介:本来不想写这个的,方正OCR软件是方正公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约40MB.
*** 汉王文友
简介:旧版
*** 超星阅览器
简介:向汉王买的技术。
*** RapidScan高速扫描影像优化OCR识别系统
简介:向汉王买的技术。
12、ExperVision TypeReader
简介:新人可能不知道,但是n年前还是满有名的。 (才$395.00 )同时也曾是国外4大OCR公司之一。
评价:ms2008年后就没更新,以前拿了n多奖,若oem盘有带,用来ocr英文还可以。 25MB。
缺点:不支持中文算不?
友情提醒:此东东不好下,没特别需要别下
13、赛酷OCR
简介:使用云系统来OCR,说土点就是叫你装一个客户端,把图片上传到服务器上,识别后再发回来。
优点:机子配置不好的,用这东东占资源少。客户端安装文件也小。
缺点:
识别率不咋的,可能还没丹青好。除了简体,繁体竖排根本不行。
机密文件你甲认为我会安心上传给你?
万一断网,偶要OCR咋办?
友情提醒:偶就纳闷,网上关于该软件的评价很高。(有人发帖问用啥OCR软件好,基本上就有人回“用赛酷”)就首次使用送10次识别,网上可能有那么多有钱的潜水支持者?可见肯定是1毛党!
14、SimpleOCR
简介:本来不想写这个的,但是这免费的东东名声蛮大的,我不说,人家可能会去下。
缺点:不支持中文
15、奥普ocr
简介:停止开发的东东。
注1:以上,就前9名OCR软件值得试!
注2:在线网页OCR不实际
注3:该软件的比较写于2010年,估计5年内有效
注4:此贴由winny社长验证,内容非常包青天
注5:软件按引擎Engine+词库分类