SolidWorks机械工程师网——最大的SolidWorks学习平台

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1328|回复: 1
打印 上一主题 下一主题

SOLIDWORKS Inspection 使用OCR编辑器创建自定义词典字体

[复制链接]

4

主题

30

帖子

22

金币

天使

Rank: 2Rank: 2

积分
87
QQ
跳转到指定楼层
楼主
发表于 2018-7-9 03:12:08 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

   经典图书
摘要:SOLIDWORKS Inspection提供了多个词典字体,为OCR引擎提供准确的结果,但这些词典字体不可能覆盖所有用户所使用的图纸文档。当提供的词典字体不能满足我们的工作需求时,可以使用OCR编辑器来自定义词典。本文介绍了OCR编辑器的使用方法和一些注意事项。

关键字:Inspection OCR 词典字体

【概述】

Inspection是一款出具首件检查报告(FAI)的工具,他可以极大地简化及自动生成检查工程图立即按序号和质量检查报告的过程。Inspection独立版可以让非CAD用户,通过PDF或TIFF工程图文档创建带零件序号的工程图和质检报告。

Inspection 独立版对PDFTIFF工程图信息的识别是基于OCR(光学字符识别引擎)将捕捉到的特征与词典进行比较,以提取并解释所获取的信息。Inspection提供了多个词典字体,为OCR引擎提供了准确的结果。



图 1 OCR示例

默认的尺寸词典字体报包括:

l Standard 标准字体库适用于主流标准的工程图文件;

l Acad 对于细印刷体较适配,例如AutoCAD或老版本的Pro/e工程图;

l CATIA 适用于CATIA生成的工程图;

l NX1 适用于Siemens NX或Unigraphics,同样适用于印刷体工程图;

l Century Gothic 适用于Century Gothic字体的工程图;



图 2 OCR选项界面

当Inspection提供的词典字体不能满足我们的工作需求时,可以使用OCR编辑器来创建自定义词典。OCR编辑器可以让用户从已有的PDF和TIFF文档生成自定义的词典,通过框选特征然后指定我们期望的值实现。


【注意事项】

1. OCR引擎对词典字体的匹配非常严苛,稍有不同就可能识别错误,选择相匹配的词典字体有助于提高我们的工作效率

2. 为了快速提取特征,我们可以在工程图可空白处添加所有的特征和符号,以空格进行区分;

3. 字母、数字或符号都可以使用提取分别提取并指定值,也可以使用自动提取,框选多个特征,再分别指定正确的值;

4. 提取完成后可以删除或修改不正确的值;

5. 为了获得最佳效果,推荐重复提取相同的特征3 ~ 5次;

6. 目前仅支持水平和垂直方向的特征,带有角度的特征还无法捕捉;

7. 词典默认保存在C:ProgramDataSOLIDWORKSSOLIDWORKS Inspection 2018 StandaloneTrainableOCR文件夹下;

【操作步骤】

1. 启动Inspection 独立版,在文件栏里找到OCR编辑器,点击进入;

2. 单击添加工程图,打开我们的工程图文件;本文所使用的工程图已经把所需要的特征添加到了左上角空白处,如图3;



图 3带字母、数字及符号


3. 单击提取,手动款选单个特征,发现在下方框特征里的值一栏红色显示问号,如图4;我们可以在左侧提取栏中输入正确的值。字母、数字和常见的符号可以直接键盘输入。一些特殊的符号可以单击值域右侧Ω【Insert Symbol】图标,如图5,插入所需的符号。


图 4框特征



图 5提取栏

4. 可以使用自动提取框选整行特征,系统会自动进行识别赋值;检查每个特征是否识别正确,对不正确的特征可进行修改或删除后重新提取识别;


图 6自动提取


5. 在正确提取了所有的特征后,单击保存,选择保存地址确定后,弹出图7对话框则说明保存成功,单击确定;



图 7弹出对话框


6. 回到Inspection Standalone界面,单击【主页】/【选项】/【项目选项】/【OCR】,在尺寸OCR一栏勾选自定义,单击+,找到我们刚保存的词典文件,注释OCR词典栏有需要也可以同样添加自定义词典,两者可用同一个词典文件;


图 8选项设置

7. 单击确定后就可以使用我们自定义的词典对工程图进行OCR识别了


【结果对比】

我们打开一幅用非标准字体绘制的工程图,用默认Standard字体进行标号,发现尺寸识别正确率不高,如下图所示,字母R识别成了72,小数点没识别到。


图 9错误识别

使用自定义的词典字体之后,我们可以发现该尺寸识别正确


图 10自定义词典正确识别



【总结】

虽然Inspection官方已经为客户提供了相当完善的词典字体,能够满足大部分主流工程图纸的识别。但是仍有部分字体没有覆盖,并且OCR引擎对于字体库的匹配非常严苛,与字体库稍有不同就可能识别错误,需要手动修改,影响工作效率。所以在遇到多份字体相同、使用官方提供的词典字体识别正确率不高的时候,创建一个自己的词典字体就显得很有必要了。我们只需要创建一次词典文件,在遇到同样使用该字体的工程图的时候,选择自己创建的自定义词典将大大提高OCR识别的正确率,提高我们的工作效率!
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享教程|习题|模型|技巧 点赞点赞 拍砖拍砖
SolidWorks机械工程师网
提示:建议使用谷歌浏览器浏览本网站!如单击这里下载!否则,可能无法下载附件文件!(支持大多数版本的谷歌浏览器,支持360和QQ浏览器的极速模式,即谷歌内核模式,使用IE和Edge浏览器,浏览个别网页以及下载文件时,会误报“***不安全”,此时需要单击“继续访问此不安全站点(不推荐)”才可以继续下载,另外,本网站不含任何不安全的文件,已联系微软公司解决,纯属IE和Edge浏览器误报)
回复

使用道具 举报

7

主题

26

帖子

37

金币

天使

Rank: 2Rank: 2

积分
104
QQ
沙发
发表于 2018-7-14 15:21:39 | 只看该作者
sorry 誤操作...
SolidWorks机械工程师网
提示:建议使用谷歌浏览器浏览本网站!如单击这里下载!否则,可能无法下载附件文件!(支持大多数版本的谷歌浏览器,支持360和QQ浏览器的极速模式,即谷歌内核模式,使用IE和Edge浏览器,浏览个别网页以及下载文件时,会误报“***不安全”,此时需要单击“继续访问此不安全站点(不推荐)”才可以继续下载,另外,本网站不含任何不安全的文件,已联系微软公司解决,纯属IE和Edge浏览器误报)
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭 卷起
关闭 卷起

SOLIDWORKS 2023 机械设计从入门到精通

手机版|小黑屋| GMT+8, 2024-9-17 04:20 , Processed in 3.416976 second(s), 25 queries , Memcache On.

SolidWorks机械工程师网 ( 鲁ICP备14025122号-2 ) 鲁公网安备 37028502190335号

声明:本网言论纯属发表者个人意见,与本网立场无关。
如涉版权,可发邮件: admin@swbbsc.com

快速回复 返回顶部 返回列表