几款OCR识别软件介绍--688IT编程网

⼏款OCR识别软件介绍

汉王OCR

在最近⼏年中，OCR识别技术随着扫描仪的普及得到了飞速的发展，扫描、识别软件的性能不断强⼤并向智能化不断升级发展。

OCR 是英⽂Optical Character Recognition的缩写，意思为光学字符识别，通称为⽂字识别，它的⼯作原理为通过扫描仪或数码相机等光学输⼊设备获取纸张上的⽂字图⽚信息，利⽤各种模式识别算法分析⽂字形态特征，判断出汉字的标准编码，并按通⽤格式存储在⽂本⽂件中，由此可以看出，OCR实际上是让计算机认字，实现⽂字⾃动输⼊。它是⼀种快捷、省⼒、⾼效的⽂字输⼊⽅法。

汉王OCR 是针对机关单位、企业及有⽂字录⼊需求的个⼈⽤户，在⽇常的⼯作中，快速的对书刊、报纸、公⽂、宣传页等印刷稿件中内容进⾏录⼊的应⽤需求⽽推出的。本产品集成了汉王科技顶尖的⽂字识别技术，对印刷⽂稿录⼊的识别率⾼达99.5%，能够识别百余种印刷字体和各种中英繁表图混排格式的⽂本，。是理想的⽂字、表格、图像录⼊系统。

这样⼀来，就不⽤再⼿⼯输⼊⼤量的资料了，只要扫进去，像那种抓英⽂的⼯具⼀样，让软件⾃动地转成

WORD⽂档。即可将图⽚变成可编辑的⽂挡格式。这是⽬前破解最完美的汉王OCR软件。

丹青中英⽇⽂OCR 辩识⽩⾦版4.5

安装序列号：MXRD450-7DMN-MM7M-CFCB

功能简介

原⽂重现尽在瞬间

◎提供繁中、简中和⽇⽂三种操作介⾯

◎可辨识繁中、简中、英⽂及⽇⽂四种⽂件

◎辨识后的⽂件可储存成各种常⽤档案格式再编辑

◎超⾼辨识速率及辨识率再提升，快速原⽂重现各式⽂件

产品说明

影像扫瞄

1. 可处理彩⾊、灰阶或⿊⽩的⽂件影像。

2. 倾斜校正：⾃动侦测⽂件影像倾斜⾓度，并提供旋转影像之功能。

辨识⽂件

1. ⾃动辨识：轻按⼀钮，即可⾃动分析、辨识、校对影像⽂件，图⽂分离，并转换成可编辑的⽂件档案。

2. 设定辨识字集：不需切换语⽂环境，即可辨识繁中、简中、纯英⽂及⽇⽂四种⽂件。

3. ⾼辨识速率：在Pentium III 667MHz个⼈电脑环境下，每秒钟能辨识⾼达150个中⽂字。

4. 多种字体辨识及重现：能够辨识多种印刷字体，如明体、⿊体、仿宋体、楷书、圆体、⾪书等，并在辨识后还原成原稿的字体。

5. 原⽂重现编辑环境：可辨识各种表格及影像，辨识结果依照原⽂件的图⽂版⾯格式呈现，⽅便您校对、编辑，节省重新排版的时间。

1. 再辨识功能：提供合/分字、合/分⾏、合/分区块、变更区块属性等再辨识功能，让您能够修正错误的辨识结果。

2. 学习新字功能：可将易辨识错误的字元输⼊到学习资料库中，提⾼下次辨识之正确率。

3. 候选字功能：提供原⽂影像供辨识后图⽂作校对，且针对型态相近之⽂字及语意上前后相连的字词提供候选字轻松更正辨识错误的⽂字。

4. ⾃动校对：利⽤内建的常⽤词库⾃动校对辨识出的⽂字，并标⽰出辨识时所碰到的疑问字，节省您校对的时间。

输出档案

1. 传送⾄其他应⽤软体：可将辨识结果直接传送⾄您所指定的应⽤软体中再处理，例如可设定辨识结果⾃动储存成HTML档案并直接传送⾄⽹路浏览器中。

2. 可储存多种档案格式：辨识后的结果可储存成不同之档案格式，如TXT、RTF、DOC、XLS、SLK、CSV、HTML等，⽅便您做不同的应⽤与处理。

www.doczj/doc/3e11785848.html

/soft/6/64/248.html

清华紫光⽂通TH-OCR 9.0 光盘完全特别版

把破解补丁放到安装⽬录下，运⾏破解补丁，确定，OK！

TH-OCR简介

OCR是英⽂Optical Character Recognition的缩写，意思为光学字符识别，通称为⽂字识别，它的⼯作原理为通过扫描仪或数码相机等光学输⼊设备获取纸张上的⽂字图⽚信息，利⽤各种模式识别算法分析⽂字形态特征，判断出汉字的标准编码，并按通⽤格式存储在⽂本⽂件中，由此可以看出，OCR实际上是让计算机认字，实现⽂字⾃动输⼊。它是⼀种快捷、省⼒、⾼效的⽂字输⼊⽅法。

TH-OCR是清华⼤学⾃1985年就开始研发的，TH是TsingHua（清华）的缩写，TH-OCR 代表北京清华紫光⽂通信息技术有限公司开发的OCR软件。在国家“863”计划⽀持下，持续了⼗多年的科研成果，从1.0版本开始已经升级到现在的9.0版本。独家真正实现了汉英混排同时识别，在国际上⾸次突破了OCR产品只能处理汉字或英⽂单⼀⽂字的局限性，新增了东⽅⽂字（简繁汉、⽇⽂、韩⽂）识别功能，对⽇⽂和韩⽂与英⽂混排⽂档的识别⽔平甚⾄超过⽇本和韩国对本国⽂字的识别⽔平，在国内、外产⽣了重⼤的影响，并连续3年被中国软件⾏业协会评为优秀软件产品，成为汉字输⼊技术的⼀座⾥程碑。TH-OCR9.0版本已应⽤到了包括电⼦政务、电⼦出版物、报社、银⾏、邮政、税务、图书馆等多个领域，成为国内OCR市场的先锋。

本届两会代表的所有提案全部采⽤了我国⾃主知识产权的世界识别领域领先产品——清华紫光⽂通的TH-

OCR9.0进⾏录⼊识别，它以准确的识别率、优异的识别速度博得了两会⼯作⼈员的交⼝称赞。⽽清华TH-OCR技术在两会上的成功应⽤更论证了我国也完全有实⼒拥有⾃⼰的卓越技术。

TH-OCR的突出特点：

◇汉英双语同时混排，识别率最⾼，居世界领先⽔平。

◇可以识别⿊⽩、灰度、彩⾊图像，可以读取多种图像格式。

◇⾸创对识别结果进⾏电⼦⽂档版⾯复原功能，所见即所得。

◇⾸创⽇⽂、韩⽂、⽇英混排、韩英混排识别功能，识别率98%以上。

TH-OCR的六⼤优势：

1. 是唯⼀可以识别２万多汉字的多体⽂字识别系统，汉字识别国内最优。

2. 汉字和英⽂混排、⽇⽂和英⽂混排、韩⽂和英⽂混排同时识别。

3. 汉字识别率最⾼。清华紫光⽂通TH-OCR经过"863"智能专家组对数⼗万字的指标评测和中国软件评测中⼼对产品的严格测试，识别正确率超过99.5％，代表了⽬前印刷体⽂字识别的最⾼⽔平。

4. ⽀持多种环境接⼝。清华紫光⽂通TH-OCR⽀持WINDOWS环境和GB、BIG5、GBK、JIS、SHIFT-JIS和KSC等多种内码，可以⽤于WINDOWS NT和WINDOWS 98/2000/XP，适合全球各个地区使⽤。TH-OCR还具有⾃学习功能，不论什么⽣僻字，都可以通过键盘输⼊进⾏学习，⼤⼤拓宽了OCR系统的识别字符集。

5. 历次国内鉴定均被中国科学院院⼟和中国⼯程院院⼟等专家组成的鉴定委员会评定为“具有世界领先⽔平”。

⼴泛的社会认可：字体免费的软件

1、多年来为众多著名的扫描仪⼚商HP、UNISCAN、EPSON、CANON、LENOVO等提供TH－OCR普及版作为其扫描仪的捆绑软件。

2、美国MICROSOFT公司将TH-OCR作为东⽅⽂字识别捆绑到WINXP 操作系统中。

3、美国MOTOROLA公司确定TH-OCR的部分技术使⽤权。

4、美国INTEL公司确定TH-OCR为最新的MMX技术⽀持项⽬。

5、《计算机世界》市场调查结果，清华紫光⽂通TH-OCR市场占有率达65％以上。

6、《中国计算机报》CIWLAB组织的⽤户调查认为，TH-OCR是⼀个性能极好的系统，是⼀个值得⽤户信赖的系统（对其他品牌OCR评价为：“是值得⽤户选择的产品”）。

尚书7号OCR ⽂字识别系统完全版Shocr7.0

本软件系统是应⽤OCR（Optical Character Recognition）技术，为满⾜书籍、报刊杂志、报表票据、公⽂档案等录⼊需求⽽设计的软件系统。⽬前，许多信息资料需要转化成电⼦⽂档以

便于各种应⽤及管理，但因信息数字化处理的⽅式落后，不但费时费⼒，⽽且资⾦耗费巨⼤，造成了⼤量⽂档资料的积压，因此急需⼀种快速⾼效的软件系统来满⾜这种海量录⼊需求。本

软件系统正是适⽤于个⼈、⼩型图书馆、⼩型档案馆、⼩型企业进⾏⼤规模⽂档输⼊、图书翻

印、⼤量资料电⼦化的软件系统。

●识别字符

简体字符集：国标GB2312-80的全部⼀、⼆级汉字6800多个。

纯英⽂字符集。

简繁字集：除了简体汉字外，还可以混识台湾繁体字5400多个以及⾹港繁体字和GBK汉字。

●识别字体种类

能识别宋体、仿宋、楷、⿊、魏碑、⾪书、圆体、⾏楷等⼀百多种字体，并⽀持多种字体混排

。

●识别字号

初号⼩六号字体。

●表格识别

可以⾃动判断、拆分、识别和还原各种通⽤型印刷体表格。

●可⽀持繁体WINDOWS系统

⾸先，尚书七号开始将整个OCR的过程，明确化了，通过程序的菜单，我们就能够知道整个OCR

的过程，主要分为：“⽂件”、“编辑”、“识别”、“输出”等步骤。

在⽂件菜单中，您可以调⽤扫描仪，或者选择将已经扫描好的图像⽂件打开。得到图像⽂件后

，⽤户开始的⼯作，就是“编辑“菜单⾥⾯所提⽰的：图像页⾯的处理，其中包括图像页的倾

斜校正（提供⾃动和⼿动实现⽅法），旋转等功能。

处理完毕后，就可以进⼊“识别过程”，该过程关键的是“版⾯分析”，现在尚书七号的⾃动版⾯分析功能很强，⾯对报纸杂志等复杂情况的版⾯，也是分析的正确率很⾼。不再需要我们

在尚书六号⾥⾯那样的建议⼿⼯划识别范围。也正是这点，⼤⼤降低了使⽤者的⼯作量。为了

⽅便，“识别”菜单下，也提供了⽤户⾃⼰在⾃动版⾯分析后，通过修改识别范围框的属性，来决定需要识别否的功能（默认的情况下，图象属性的栏⽬是不⽤识别的。当然，如果⽤户还

是习惯原来尚书六号那样，⾃⼰来设定识别区域，只要直接⽤⿏标划框就可以了。接下来，⽤

户就可以直接选择“开始识别”的按钮了，等待识别的结果。

赛酷OCR ⽹络版

《赛酷OCR⽹络版》是赛酷科技推出的⾸款⽹络OCR软件，该系统以SAAS(软件即服务)作为设计理念，

集复杂版⾯分析、⽂字识别，表格识别，公式识别多项专有技术于⼀体，充分满⾜了政府公务员、企业经营管理⼈员、教师学⽣、科研⼈员、编辑

记者等⽇常⽂档录⼊的需要，极⼤地提⾼了⼯作效率和质量。

《赛酷OCR⽹络版》即时注册、免费体验。

特点：

简繁体识别、中英混合识别、纯英⽂识别

⾼速度（6000字/分钟），⾼识别率（99.5%）

标准版⽀持宋、⿊、楷、圆、仿宋字体识别

专业版⽀持⾏书、⾪书、魏碑、综艺等字体

纯软件，⽀持多种图像⽂件格式（BMP、JPG、TIF、多页TIF、PDF等）

⽀持TW AIN扫描驱动，可与任何扫描仪直接相连

复杂版⾯⾃动分析、⾃动倾斜校正、表格⾃动测定、公式⾃动测定（专业版）

⼀键进⼊WORD、WPS

⽀持MATHTYPE，识别的数学公式可直接嵌⼊WORD，由MATHTYPE编辑修改

操作简洁⽅便，⼈性化操作界⾯完全，符合您以往⼯作习惯

可由⽤户设定识别区域，设定竖版、单栏、图像、表格、公式局部定义

可去除印章，图像修正（擦除、连线、图像平衡）

在线专家⽀持，您在使⽤中的任何问题，都会得到迅速准确耐⼼的解答

FineReader OCR

ABBYY 是⼀家俄罗斯软件公司，在⽂档识别，数据捕获和语⾔技术的开发中居世界领先地位。其获奖产品FineReader OCR 软件可以把静态纸⽂件和PDF ⽂件转换成可管理的电⼦数据，可以⼤⼤节省您的时间和精⼒。2005年12⽉22⽇，ABBYY 美国宣布，ABBYY FineReader 8.0 专业版被美国着名计算机杂志《PC Magazine》授予4星。（以上摘⾃官⽅介

绍）

ABBYY FineReader Professional 是⼀款真正的专业OCR，它不仅⽀持多国⽂字，还⽀持彩⾊⽂件识别、⾃动保留原稿插图和排版格式以及后台批处理识别功能，能够直接在MS Word、MS Excel、WordPerfect 及Word Pro 中扫描和读取⽂件、信件或各类表格，并且能存成RTF、TXT、DOC、CSV、XLS 或HTML 等格式。它能保持表格与图⽚中原始的多栏页⾯设计。FineReader Professional 在识别⽅⾯⽀持ADF (⾃动进纸)扫描仪，批处理，拼⾳检查，强⼤的表格⼯具，多语⾔⽂件，背景运算和学习新的字体。它也完全⽀持TW AIN 扫描仪。。

ABBYY FineReader 8.0 Professional Edition 主要功能：

1.出⾊的识别率和版⾯还原

ABBYY FineReader 8.0 提供出⾊的识别率和版⾯还原，即使⾯对读取困难的或低品质的⽂档也如此。FineReader 完美的获取并且重建所有的格式化要素(包括分栏、表格、列表和图象) –你⽆需重新打字或重新排版。

2.数码相机OCR ：可以将数码相机列⼊到移动⽂档捕获设备⾥

现在您可以使⽤数码相机获取⽂件并将其转换为可重⽤信息。ABBYY FineReader 可以智能识别被拍摄的⽂档并且应⽤ABBYY 的新的识别技术以保证数码相机图象能得到最佳的OCR结果。因为有数吗相机

OCR，FineReader 提供了⼴泛的可能性来迅速获取⽂档并将其转换成可编辑和可搜索的电⼦⽂件，即使在您忙个不停的时候。

使⽤数码相机来OCR，您能不受传统扫描设备的限制。您能从⼤海报或从厚重、精装的⽂档，如书中获取⽂本，⽽这类⽂档是很难扫描的。另外，使⽤数码相机获取⽂档是⾮常⾼效的，⽐扫描快⼏倍。

3.准确、快速和安全的PDF 转换

ABBYY FineReader 8.0 是⼀个理想的PDF 转换⼯具。它在⼀个应⽤程序中提供三个不同的PDF转换功能：

打开PDF ⽂件并且转换它成可编辑的格式（例如Microsoft Word 或Excel）。

打开PDF ⽂件，执⾏少量正⽂编辑，然后保存回PDF。

从纸上⽂档创建可搜索的PDF ⽂件。

加密PDF

ABBYY FineReader 遵照了最新的加密标准。⽤FineReader，您能创建加密的PDF ⽂件，带有⽤先进

加密标准(AES)创建的最⾼128 位加密。FineReader 也遵从访问权限保护：当打开⼀个PDF ⽂件要转换时，FineReader 会提⽰⽤户在执⾏之前输⼊密码。

⽹络发布PDF 和标记PDF

ABBYY FineReader 遵照了最新的加密标准。⽤FineReader，您能创建加密的PDF ⽂件，带有⽤先进加密标准(AES)创建的最⾼128 位加密。FineReader 也遵从访问权限保护：当打开⼀个PDF ⽂件要转换时，FineReader 会提⽰⽤户在执⾏之前输⼊密码。

4.⽤⾃动操作管理器进⾏⼀键OCR

⽤新增的⾃动操作管理器，您可⽤⿏标的唯⼀单击执⾏完全的转换任务。ABBYY FineReader 内置了针对最普通的⽂档处理流程的计划任务，包括扫描（及OCR）到Word，扫描到PDF，及PDF 到Word。

您也可以使⽤⾃动化向导来创建您⾃⼰的⾃定义任务。向导会引导您通过创建新任务的步骤。任务可以在ABBYY FineReader 8.0 中使⽤命令和选项进⾏⾃定义和微调，因此您能迅速和容易地⾃动化甚⾄于最特别的任务。例如，您可以指定⼀个任务来扫描⽂档，载⼊模板，进⾏OCR，然后保存结果到Word 和PDF，并像原始图象⼀样，保存在不同的⽂件夹中。

⾃动任务可以容易地被导⼊和导出。⼀旦您创建了⼀些有⽤的⾃动任务，您可以将其导出为⽂件并与您

的同事和朋友分享。

5.多语⾔识别

ABBYY FineReader ⽀持179 种语⾔，包括英语、德语、法语、希腊语、西班⽛语、意⼤利语、葡萄⽛语、荷兰语，瑞典语，芬兰语，俄语，乌克兰语，保加利亚语，捷克语，匈⽛利语，波兰语、斯洛伐克语、马来语，印度尼西亚语和其他。内置拼写检查可以⽀持其中36种语⾔。这为与各种各样不同的国家（地区）和⽂化打交道的⼈简化了⽂档转换过程。

注意：不⽀持中、⽇、韩等语⾔

6.直接发送结果到Microsoft Word，Excel 和更多程序

当您转换⽂档来编辑时，ABBYY FineReader 8.0 可以直接地向您喜爱的应⽤导出结果，包括Microsoft Word、Microsoft Excel、Microsoft PowerPoint、Lotus Word Pro、Corel WordPerfect、Sun StarWriter 和Adobe Acrobat/Reader。另外，识别的的⽂本可以被保存为各种各样的⽂件格式，包括PDF，HTML，Microsoft Word XML、DOC、RTF、XLS、PPT、DBF、CSV、TXT 和LIT。

7.为即时OCR 附加的ABBYY Screenshot Reader 实⽤程序

ABBYY Screenshot Reader 是⼀个易⽤的⼯具，可以让您迅速获取屏幕图像并且允许您从屏幕进⾏“即时”OCR。它对摘取⽂本、表格或者浏览器页⾯图像、flash 介绍，Windows Explorer “⽂件”菜单或者错误消息来说是很理想的。当您想要从PDF 或图像⽂件摘取⼩的节录或⽂本中的⼏个句⼦时，Screenshot Reader 也是⼀个理想的“快速OCR”⼯具。作为对注册⽤户的奖励，ABBYY Screenshot Reader 与ABBYY FineReader 8.0 专业版同时发⾏。

8.与Microsoft Word 协同

您可以从Microsoft Word 内部启动ABBYY FineReader，扫描纸质⽂档并将识别结果置⼊您正在操作的⽂档中⽽不⽤离开Word。

当导出⽂件到Microsoft Word 2003 时，FineReader ⾃动地打开原⽂件的⼀张嵌⼊视图，允许您同时编辑和查验您的⽂档，这就不需要在两种应⽤程序之间切换。

9.所见即所得的⽂本编辑器

多分栏所见即所得⽂本编辑器允许您在编辑期间查看扫描⽂档的完整版式，因此您可以在导出它之前迅速检查⽂件。

10.带有词法⽀持的全⽂搜索

在ABBYY FineReader 中创建的任何批处理⽂件都可以作为⼀个带有全⽂搜索功能的⼩数据库使⽤。您可以⽤所有语法形式搜索单词。此功能⽀持有词典⽀持的36种语⾔。

11.条型码识别

ABBYY FineReader 也⽀持条型码识别，包括PDF-417 2D 条码的识别。这对需要处理并索引很⼤数量的⽂档为存档的公司来说是很理想的功能。

688IT编程网

几款OCR识别软件介绍

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

几款OCR识别软件介绍

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式