首页 | 乐园 | 淘宝店 | 社区 | 电驴 | 网页游戏 | 网址大全

热门搜索: windows photoshop photoshop cs 黑客 microsoft office 金山词霸 cs xp

v

当前位置:VeryCD软件应用软件

软件资源事务区


《尚书7号OCR文字识别系统完全版》(Shocr)Shocr7.0,Shocr6.0

状态: 精华资源
摘要:
发行时间2005年10月30日
制作发行北京汉王科技有限公司
时间: 2006/01/16 10:44:10 发布 | 2006/01/16 10:44:10 更新
分类: 软件   应用软件  
统计:166次 收藏
收藏: fav  分享给好友
相关: 分享到开心网  分享到校内  收藏到QQ书签  订阅本资源RSS更新  美味书签  subtitle
中文名尚书7号OCR文字识别系统完全版
英文名Shocr
版本Shocr7.0,Shocr6.0
发行时间2005年10月30日
制作发行北京汉王科技有限公司
地区大陆
简介

IPB Image
己通过瑞星,金山检测无毒
一般情况下是早上9:00--晚上11:00开源,adsl比较慢,不过一定保证有源。。。
常在Razorback2.0,Razorback 2.1上
本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
●识别字符
简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。
简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
● 识别字号
初号 小六号字体。
●表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。
●可支持繁体WINDOWS系统
首先,尚书七号开始将整个OCR的过程,明确化了,通过程序的菜单,我们就能够知道整个OCR的过程,主要分为:“文件”、“编辑”、“识别”、“输出”等步骤。
在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户开始的工作,就是“编辑“菜单里面所提示的:图像页面的处理,其中包括图像页的倾斜校正(提供自动和手动实现方法),旋转等功能。
处理完毕后,就可以进入“识别过程”,该过程关键的是“版面分析”,现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也是分析的正确率很高。不再需要我们在尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。为了方便,“识别”菜单下,也提供了用户自己在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能(默认的情况下,图象属性的栏目是不用识别的。当然,如果用户还是习惯原来尚书六号那样,自己来设定识别区域,只要直接用鼠标划框就可以了。接下来,用户就可以直接选择“开始识别”的按钮了,等待识别的结果。

6.0说明
是iso镜像文件,请用winiso解开。内带对扫描仪限制的破解 尚书6号使用感觉 下载尚书6号后,使用各种不同类型、不同质量的文本对它进行了识别效果判定,结果确实出乎我的意料: 1、识别率同尚书5号比大幅提高。克服了尚书5号对低质量文本识别率低的弱点,对于低质量文本同样得心应手,而且英文和数字的判别改进不小。各方面的综合识别效果超过了紫光OCR千禧专业版和7.5MF版。 2、其重大改进是能支持灰度和彩色图像的识别,识别效果也颇令人满意。而紫光千禧版不能识别彩色图像。 3、尚书5号只支持其本身扫描的二值tif图像,这一令我一直不满的限制在6号中终于不再存在。经过使用和对比,尚书6号确实不负它40M的个头。以前我一直对尚书不太满意,首选紫光,现在尚书6号的出现终于让我作出了新的选择,特别是在紫光千禧版的令人失望之后

尚书7号OCR使用方法示例一
尚书7号OCR使用方法示例一

因为不断有用户来电咨询尚书7号软件的使用,为此我们这里特别写了一份关于尚书7号软件的使用方法的实际例子,来帮助用户使用好尚书7号OCR软件。其中,很多是我们自己在使用尚书软件的心得,请用户尽量按照示例来操作。

一、 扫描仪驱动程序请切换到高级控制面板状态

为了得到较好的OCR使用效果,建议用户将扫描仪的驱动SCANWIZARD 5软件,由初始安装的标准控制面板,切换到高级控制面板状态。其切换的方法,如下图所示。


IPB Image
二、 第一次使用尚书OCR7号软件

1. 尚书7号OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的软件,该软件是放在了扫描仪随机的驱动光盘中,用户可以选择安装。

2. 软件安装完毕后,用户请点击桌面左下角“开始”,找到“尚书7号OCR”软件图标,并点击。打开尚书7号OCR的使用界面。

IPB Image
3. 打开尚书7号OCR的“文件”采单下的“选择扫描仪”,选择对应扫描仪的驱动“MICROTEK SCANWIZARD 5”的选项。并选择“确定”。
IPB Image
4. 选择“文件”菜单下的“扫描”,将打开扫描仪的驱动。如下图,下面的界面是扫描仪的“高级控制面板”。
IPB Image
5. 拥护请注意选择SCANWIZARD 5软件中,左面“设置”窗口中的“图像类型”,请选择“RGB色彩”或者“灰阶”的类型,并注意扫描仪分辨率是300PPI。
IPB Image
6. 当用户作完“预览”后,设置需要扫描的范围,就可以点击“扫描”按钮,扫描仪将开始扫描的工作。将扫描好的文件,直接传递到尚书7号OCR默认的目录中(默认的存储图像文件的目录是用户计算机C盘下的SHOCR2002目录下的IMAGE目录)。扫描完毕后,请用户关闭掉扫描仪驱动程序SCANWIZARD 5.用户可以看到需要扫描的文件已经传递给尚书7号中,默认的文件名是HW001.JPG。

7. 请用户选择尚书7号软件中的“编辑”菜单下的“自动倾斜校正”,让尚书7号软件对扫描进来的图像作相应的旋转,以保证图像中的文字是水平排列,而非倾斜。因为太过倾斜的文字,将影响到尚书软件的识别效果。
IPB Image
9. 版面分析完毕后,用户可以看到对应的文字块,都有对应的识别框被选择,如下图
IPB Image
10. 用户此时,请注意,对应的识别框,其属性是否正确。识别框分别有“横栏”、“竖栏”、“表格”和“图像”等四种属性,分别有四种不同颜色的选框来表示
IPB Image
11. 核对无误后,用户可以使用“识别”菜单下的“开始识别”按钮。得到的结果如下:
IPB Image
12. 此时实际上已经进入文字校对状态:
IPB Image
13. 当用户校对完毕后,或者不在尚书7号内作校对,用户可以选择“输出”菜单下的“到指定格式文件”,如下“
IPB Image
用户可以看到,识别的结果,有TXT、RTF、HTML、XLS等格式可以选择。默认的输出的目录是用户计算机C盘下的SHOCR2002目录下的OUTPUT目录。用户选择一个对应的文件名,就可以存盘了。为了方便,用户可以选择“输出到外部编辑器”的选项,这样存盘的同时,尚书7号OCR会自动调出对应的编辑软件,如TXT存盘可以自动调用NOTEPAD软件,RTF存盘将自动调用WORD软件,XLS存盘将自动调用EXCEL软件。

一个简单的OCR操作就此完成了。

三、 普通文档(只含有文字)的OCR识别

1. 过程与上面所介绍,基本一样,只是用户需要注意存盘格式。

2. 一般,如果用户需要对该文字,进行重新排版工作,请用户选择TXT存盘,然后再将其内容拷贝到WORD中。

3. 如果用户希望保留稿件的原有格式,并能够作版面的恢复,请使用RTF格式存盘,该格式将有版面的恢复功能。但是用户只能针对其中的文字,作一些个别字的调整,无法作大范围的排版方式的修改。

四、 带表格的稿件的OCR识别

1. 其中,扫描、自动倾斜矫正过程同普通文稿是一样的。

2. 但是注意“版面分析”后,对其结果进行检查。应该在表格上,经过版面分析后,有一个兰色的框,选中了表格部分,如果不是,用户需要修改栏属性或者考虑手动划定识别区域。

IPB Image
3. 注意输出结果的选择,如果是需要重新排版,用户应该分别用TXT和XLS格式存盘,然后将TXT中的文字和XLS中的表格分别拷贝到WORD,进行排版。

More ...更多相关资源 >>

这里是其它用户补充的资源(我也要补充):

暂无补充资源

最新评论

voldemorte   2008/01/04 15:17:45  1楼   举报

嗯,先下来试试,感谢楼主分享。
顺便问一句,要注册吗?


[+6] [0] [回复]

回到最上

rzexin   2008/01/04 23:54:28  2楼   举报

好东西,不错


[+2] [-1] [回复]

回到最上

linzhenhan   2008/03/21 23:13:43  3楼   举报

这两个文件有什么区别吗?


[+2] [0] [回复]

回到最上

jjssdd   2008/04/27 11:27:00  4楼   举报

用过尚书6,不知尚书7比尚书6有什么改进.


[+1] [0] [回复]

回到最上

白玉兔   2008/10/01 22:19:34  5楼   举报

识别率太低了!


[+5] [-1] [回复]

回到最上

pqqrrr   2008/11/16 02:00:40  6楼   举报

正在找这类软件,谢谢。


[0] [0] [回复]

回到最上

lianchao1976   2008/11/29 22:10:56  7楼   举报

绝对好东东,我店里一直用着。
但是要注意原文件的质量,如果原文件不太好,最好能在PHOTOSHOP里适当调整一下亮度和对比度,图形文件质量越好,识别的准确率越高。


[+3] [0] [回复]

回到最上

kingpal   2009/01/02 02:47:20  8楼   举报

先做个记号,我不知下了没有?去查查。


[+2] [0] [回复]

回到最上

billybettyliu   2009/01/07 20:15:19  9楼   举报

收下来了,很不错的东西,谢谢楼主


[0] [0] [回复]

回到最上

jacktw   2009/02/11 17:29:43  10楼   举报

值得推薦,適用繁體Windows XP且自動轉簡為繁。謝謝
可惜無法PDF直轉WORD。


[0] [-2] [回复]

回到最上

mmm333www   2009/02/12 20:45:36  11楼   举报

我正在找此类软件。真是瞌睡来了遇到枕头,谢谢噢!


[+1] [0] [回复]

回到最上

lt671   2009/02/14 21:06:49  12楼   举报

看起来好像不错,听说也还行,先试试看再说,不过当然要先谢谢楼主了。


[0] [-1] [回复]

回到最上

花豹   2009/02/19 19:34:52  13楼   举报

不知是这个好还是清华紫光好?


[+1] [0] [回复]

回到最上

smiledog   2009/03/07 10:30:57  14楼   举报

两个文件到底有啥子区别呢?我想知道啊!楼主说明得不详细啊!


[0] [-1] [回复]

回到最上

llahha   2009/03/07 11:51:58  15楼   举报

[尚书7号OCR文字识别系统完全版].Shocr60.rar 解压后的 iso文件,用虚拟光驱deamon 4.30.1无法打开。
是不是文件有问题?


[0] [0] [回复]

回到最上

巨子   2009/03/20 13:33:05  16楼   举报

不错,用注册吗吗


[+1] [0] [回复]

回到最上

cygnuszzz   2009/03/27 09:05:18  17楼   举报

能做批处理么?


[0] [0] [回复]

回到最上

baishushu   2009/03/29 22:30:17  18楼   举报

下载安装成功,识别率高(特指前者44.4M的)。非常感谢楼主分享。


[0] [-1] [回复]

回到最上

直拍横打   2009/04/27 00:07:16  19楼   举报

拿下来 试试看 了


[0] [0] [回复]

回到最上

wskanf   2009/04/30 11:48:55  20楼   举报

[尚书7号OCR文字识别系统完全版].Shocr60.rar 这个跟前面那个有什么不同?是尚书6号吗?


[+3] [0] [回复]

回到最上

hiberhe   2009/05/02 09:38:05  21楼   举报

识别率不错,要是像ABBYY FineReader 那样支持比较完美的版本还原就好了


[+1] [-1] [回复]

回到最上

cjwangxin   2009/05/18 10:35:47  22楼   举报

好东西,我顶!


[+1] [0] [回复]

回到最上

cjwangxin   2009/05/18 10:37:32  23楼   举报

好东西,我找了很久,不知在哪下载


[+1] [0] [回复]

回到最上

zzhangjie   2009/05/26 02:58:44  24楼   举报

非常感谢,希望能用。


[0] [0] [回复]

回到最上

kuika   2009/06/10 21:31:27  25楼   举报

先试试!谢谢LZ了!


[0] [-1] [回复]

回到最上

snddman   2009/06/10 23:01:21  26楼   举报

这个扫描仪的软件也有


[0] [0] [回复]

回到最上

royalwind   2009/06/10 23:09:36  27楼   举报

好东东!


[0] [0] [回复]

回到最上

tangweida2000   2009/06/18 21:47:26  28楼   举报

支持


[0] [0] [回复]

回到最上

wxfjx1014   2009/07/21 18:49:08  29楼   举报

汉王也好意思说授权给别人,自己都侵权了,自己现在还官司缠身呢。。。。


[+1] [0] [回复]

回到最上

shelver   2009/08/11 06:52:37  30楼   举报

标记一下 ,有时间再回来下来看下
好像用过6的


[0] [0] [回复]

回到最上

luojia711603   2009/08/18 18:27:26  31楼   举报

好东西,下来用用


[0] [0] [回复]

回到最上

bybd   2009/08/20 16:04:23  32楼   举报

这个有时候会出错


[+1] [0] [回复]

回到最上

豆芽mm   2009/08/28 10:18:52  33楼   举报

怎么下载不了?


[0] [0] [回复]

回到最上

levincai   2009/09/02 20:19:17  34楼   举报

现在下来看看效果怎么样?


[0] [0] [回复]

回到最上

pinkbo   2009/09/07 16:48:32  35楼   举报

引用(白玉兔 @ 2008-10-01, 10:19 PM) *
识别率太低了!


扫描的原始文件分辨率一定要高。否则会出现识别率极低的情况。

虽然屏幕上看1024*768的和1440*900的差不多一样清楚,但软件识别起来差别还是很大的。


[0] [0] [回复]

回到最上

hyj19831027   2009/09/08 19:35:09  36楼   举报

以前下载过一个,感觉不太好用,识别的错字和乱码太多,基本上十个字中只能正确识别2-3个


[0] [0] [回复]

回到最上

Jandy19   2009/09/09 22:07:45  37楼   举报

好东西,感谢分享


[0] [0] [回复]

回到最上

hymmark   2009/09/17 11:01:13  38楼   举报

好东西,我找了很久


[0] [0] [回复]

回到最上

pengcheng38   2009/09/18 10:48:09  39楼   举报

做个标签,以后用到再下载。


[0] [0] [回复]

回到最上

skysea575   2009/09/24 13:25:58  40楼   举报

这个版本的还可以用。设置好的话,其实识别是比较好的。有问题的可以来交流一下。
现在基本上用汉王文豪7600版。


[0] [0] [回复]

回到最上

白玉兔   2009/09/25 16:08:16  41楼   举报

我说的识别率不是分辨率DPI的数量,而是讲此软件不如Readiris Pro 11 好!


[+1] [0] [回复]

回到最上

jyggxg1004   2009/09/30 15:30:49  42楼   举报

做个标签,以后用到再下载。


[0] [0] [回复]


[0] [0] [回复]

回到最上

tianchi   2009/10/11 16:33:42  43楼   举报

不知道好用不,有时间下下来看看!!!


[0] [0] [回复]

回到最上

风化岩   2009/10/15 01:07:51  44楼   举报

做个记号
谢谢楼主


[0] [0] [回复]

回到最上

超级cowboy   2009/10/15 13:55:12  45楼   举报

尚书7和汉王系列一起用


[0] [0] [回复]

回到最上

shirker   2009/10/21 22:54:44  46楼   举报

记号,比较一下再说


[0] [0] [回复]

回到最上


    小贴士:
  1. 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  2. 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  3. 勿催片。请相信驴友们对分享是富有激情的,如果确有更新版本,您一定能搜索到。
  4. 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
  5. 如果您发现自己的评论不见了,请参考以上4条。

(?)

close