DjVu开发DLP解决方案使用FineReader引擎9.0
- +1 你赞过了
【天极网网络频道】"高精度的 OCR 结果是对信息安全系统的发展至关重要。虽然第三方 OCR 引擎与我们的 DjVu 产品捆绑在一起,ABBYY FineReader 显示精度更高。另外 ABBYY FineReader 引擎处理文档中的任何语言,所以 ABBYY FineReader 引擎是完美的解决方案,将与我们的 DjVu 解决方案集成。我们考虑到使用 ABBYY FineReader 引擎的传真信息搜索解决方案扩大我们的业务。
-Heungsik Choi, DjVu 科技公司首席技术官
背景
由于信息是组织中最宝贵的资源,机密数据丢失的风险,已成为许多企业的关键问题。 科技发展迅速,不同的沟通渠道(例如IM,USB,手机)公司外的未经授权的数据丢失造成有形的增长。 机密数据或专有机密,离开组织的e-mail,拇指驱动器,即时消息,网络邮件,新的移动通信技术,HTTP和FTP链接和许多的方法有很多。
已从重要的企业信息保护的需要增加的敏感数据盗窃和滥用以及法规遵从的增韧。 最近的趋势透明度要求公司允许与客户,业务合作伙伴和供应商的信息共享。 因此,从恶意或意外泄漏的机密数据保护已经成为第一优先级的业务组织今天所面临的安全挑战之一。 应该注意到的情况下,大规模的数据丢失是由于雇主的疏忽和疏忽的错误,而不是故意盗窃。
为了确保数据泄漏防护(又称防数据泄漏产品)的内容分发和管理的各种技术工具被发明。 引人注目的利益提供了广泛组织他们提供一个更好的理解什么是敏感信息,应该如何使用,有什么办法来防止损失。 防数据泄漏产品通常部署整个组织的敏感数据进行识别和分类,监视未经授权的数据披露,并采取适当的行动,以防止任何数据泄漏。
因此,在韩国,现代建筑,主要建筑公司决定,以保护其敏感数据,并介绍数据安全系统,它投资在出站内容管理解决方案。 DjVu的科技公司设计了一套数据分类方案和存储架构系统,以保持企业的安全提供了完整的数据安全解决方案。
项目
约50多功能一体机被安装在现代建设提供了一个集中的文档管理和简化业务流程。 企业信息通过多功能硬件的浓度允许所有机密数据通过网络的全面覆盖。 跟踪打印机和MFP的活动能力,使这样的安全信息系统维护的重要和有价值的信息泄漏,将阻止雇主。
韩国的软件集成和分销公司 - DjVu的科技公司,专门在该地区的数字图像压缩,可扩展的图像浏览和安全内容的访问和管理是负责实施数据泄漏保护解决方案。 DjVu的科技公司专为现代建设的终端到终端的成熟的解决方案,用于保护企业的数字数据的保密性。
该项目旨在在创造安全的内容分发和管理的DjVu科技公司需要一个强大的和智能文档识别和数据采集系统,基于光学字符识别(OCR)技术。 最后一个通用的软件开发工具包,ABBYY FineReader引擎的9.0,选择方便的图像处理工具,文档布局分析,先进的转换和压缩,结合高品质的识别结果。 ABBYY的合作伙伴在韩国和嵌入式应用软件开发专家DIOTEK有限公司,OCR技术的无缝集成到通用软件架构。
为了确保稳健和高效的信息安全保障体系的DjVu科技股份有限公司开发了以下机制:
扫描和复印的文件存储系统架构
先进的成像技术,集成了强大的OCR工具包
分类关键字监测
综合OCR搜索处理的数据
因此,该项目的主要目标是避免公司机密信息的泄漏。 引人注目的利益提供了广泛组织他们提供一个更好的理解什么是敏感信息,应该如何使用,有什么办法来防止损失。 该项目的基础上部署企业级的多功能一体机操作。 OCR技术集成到多功能打印机,扫描和复制的所有文件被确认。 提供文件识别由DIOTEK有限公司,是基于屡获殊荣的ABBYY FineReader引擎9.0,一个强大的国家的最先进的识别和转换软件技术的软件开发工具包。
OCR应用程序,以满足数量要求由客户的特殊性,如技术支持三种语言:英语,韩语和日语,文档识别的任何页面方向。
ABBYY FineReader引擎的9.0非常适合该项目提供全面的OCR技术在多语言文件上面列出的语言和它们的组合。 它也提供了各种的影像处理工具,改进的文档图像质量的进一步确认和存档,如图像缩放和裁剪,创建预览,图像旋转,线拉直,镜像和反相。 自动检测页面方向(90,180,和270度)是必不可少的,在现代建筑的情况下,因为一个大的图像输入时的页面方向是未知的,可以是不同的。 该系统可以自动检测每个页面的方向,如果需要纠正。
数字化和处理后的信息被存储在中心数据库中,在那里它可以被容易地搜索。 精确的OCR结果允许应用索引和监测(一个特定的关键字时,打印,扫描,传真,复印,或发送,系统将设置一个通知)。
在最后阶段,所有扫描的图像和数字文件转换的DjVu®格式。 确保尽可能高的图像质量与最小的文档的文件大小,提供减少存储需求和改进的访问,而不影响图像的完整性。
工作流程
规定项目的成功整合不同的技术:OCR,DJVU图像压缩和实现最终的解决方案 - 企业搜索引擎解决方案。
项目整体实施了为期三个月的,涉及以下随之阶段:
1) 存储在统一的数据库 。 每个扫描或复制的文档图像存储在一个单独的文件夹,日期和时间命名。
2) 鉴定 。 系统确定新的图像,下降到中央存储,然后转交给识别服务器进行进一步的处理。
3) 文字识别 。 安装在两台服务器上,ABBYY FineReader引擎的9.0进行了全面的文字识别,把数字文件到搜索和可靠的格式创建文件档案。 它提供了语言支持英文,中文和韩文字符识别,同时处理多语言文档。
4) 存储公认的结果 。 OCR结果被存储为文本文件的目标文件夹中。
5)搜索引擎索引监控OCR目标文件夹,看是否到达,并开始新的文本文件索引。
6)DjVu的压缩 。 OCR存储的图像进行压缩和存储的DjVu成像有助于保持文件存档。
结果
引入现代建筑首次在文件漏电保护系统,基于OCR技术,显着减少了一些违反信息安全和建立统一的企业存储系统启用。 文档识别的最高水平所提供的ABBYY FineReader引擎的9.0延长监测信息嵌入到图像的数据 - 因此覆盖齐全的可打印的文档。
关键的好处是减少了不必要的信息泄露所造成的费用。 新的数据安全系统阻止了员工泄漏重要信息敏感文件,缩减印刷和保护机密数据不被滥用。
最后的DjVu科技公司开发了一种无与伦比的数据防护解决方案,为该客户提供了一个合规性和增强的安全系统。
最新资讯
热门视频
新品评测