文档扫描与图像处理

5分钟在浏览器中直接扫描并识别文字!

简介

  在文档电子化的过程中,常常需要从获取的图像文件中提取出需要的信息。这个过程中,最准确的方式是用机器思考的方式进行,典型的做法是识别二维码获取内容。如果您的文档满足这个条件,可以参考[二维条码识   别](../Dev-Guide/Barcode-Reader.md)。实际应用中,一般获取的图像中包含的信息是以人类思考的方式展现的,即文字。这种情况下,要让机器读懂并提取信息,就要用到**光学字符识别技术**(英语:         Optical Character Recognition,OCR)。本文中我们探讨一下如何快速的实现在浏览器中扫描并识别文字。

环境要求

node

  1. 通过npm下载本文使用的核心控件

       npm install dwt@14.0.3
    

    然后在这个目录可以看到

    目录

  2. 进入目录node_modules\dwt\samples

    可以看到

    samples

  3. 在本文中,我们要重点研究的是 OCRADocument.html。直接双击打开。在浏览器中按照提示安装控件

    安装控件

    正常情况下,安装的文件可以在 C:\Windows\SysWOW64\Dynamsoft\DynamsoftService 目录中找到。这里的核心文件主要是:DynamsoftService.exe, dwt_trial_14.0.0.0618.dll, DynamicOCR.dll

  4. 安装完成后

    刷新页面,点击第一(本地需要有扫描仪)或者第二按钮来扫描或者加载本地图片文件。由于该控件开发者是加拿大公司,相关页面是英文显示,且默认只能识别英文。所以我们加载一个英文文件并点击“OCR An Image with English”。图片的识别结果就在右面的结果框中显示出来了。是不是很简单?

    识别结果

    如果需要了解更多技术细节,可以直接看 OCRADocument.html 的JS源码。也可以直接联系免费快速的中国区技术支持

    如果你看到以下提示则表示你用的授权过期了。

    过期

    解决方案为点击上图中标红的链接,获取一个新的授权并加上下面的代码中的第一句(在window.onload回调函数中)

    Dynamsoft.WebTwainEnv.ProductKey = "<新的授权>";
    Dynamsoft.WebTwainEnv.Load();