近在身边的人工智能技术丨OCR识别
有多少人在读纸质书的时候想要使用复制粘贴的功能?或者面对一本厚厚的资料时很想用关键词检索来寻找自己需要的信息?纸质书可以带来传统的优质的阅读体验,但是在信息存储、修改、查询等方面却有着天然的硬伤。
我们在学习和办公的过程中,肯定多多少少遇到过这样的场景:
1. 在某本书或者某张报纸上看到一大段有用的文字,想要快速摘录出来;
2. 查找到的重要信息存储格式为图像或者文字不可复制的PDF,需要手动输入成文本格式;
3. 经常需要输入身份证号码或者银行卡号码之类的长串数字,需要仔细录入反复核对;
4. 有大批量的表格、单据、合同等纸质材料需要转化为电子文档保存;
5. 报销发票时候需要一张张录入票据手动计算金额;
……
把电子文本转化为图像很容易,一个截图软件就能做到。
但是反过来操作却是一个非常艰难的过程。
曾经有一种职业叫“打字员”,但如今网络上存在的“打字员招聘”已经基本是骗子的天下了。
因为我们有了更便利的方式,可以代替人工录入的工作
——OCR技术
OCR技术是Optical Character Recognition(光学字符识别)的缩写,是一种通过光学输入方式将卡证或者纸质文档上的文字转化为图像,再利用算法把图像信息转化为可以用电子设备进行编辑的文本信息的技术。
简单来说,就是一种便捷的图像转文字的技术。
传统的OCR技术流程比较复杂,需要先对通过扫描仪上传的图像进行预处理,包括灰度化、二值化、去黑边、区域定位、行切分、字切分等一系列操作。对图像质量要求高,识别率低,识别速度慢,效果差。
但现在,易道博识基于深度学习平台开发的全新OCR技术,通过扫描或者手机拍照的方式上传含有文字信息的图像,无需再进行单字切分,就可以直接将图像中的文字自动转化为可编辑的文本信息。
易道博识自主研发的基于深度学习的OCR技术大大简化了识别流程,极大的提升了识别的速度和精度,甚至针对身份证号码的识别准确率已经达到100%。
而且易道博识的OCR技术支持卡证类多方向识别,哪怕是倒立图像也不影响文字定位,极大地提升了用户体验。
如今,无论是身份证银行卡上的一大串数字,还是文字密密麻麻的纸质材料,或者是格式多种多样的发票和表单,再或者是包含了数十条重要信息的表格,都可以使用OCR技术来代替人工录入。
当今社会无纸化办公已经成为大趋势,但在从传统的办公模式到现代办公模式的过度过程中仍然会产生大量的纸质文档,需要进行信息电子化。
每天有无数的纸质资料被加工被数字化,在这个过程中引入OCR技术,相比人工一个字一个字的敲进电脑里,这种批量识别的方式不仅效率大大提升,也提高了录入的准确率,还可以极大的简化电子化流程,有效减少人力物力的浪费,缩减运营成本。
当前OCR技术已经相当成熟,相关技术的应用也在诸多领域落地开花。
很多人不熟悉这个名词,但不代表没有使用过这个功能。手机里的图像转文字的小程序,从图片中提取文字的功能,网络平台扫描证件实名认证,自助开户刷身份证登记信息,日常生活和工作中处处都是OCR技术应用的身影。
随着OCR技术的应用越来越广泛,人们对这种人工智能技术的认可度越来越高,对优质效的OCR产品需求也越来越多。
市面上不同的OCR产品,由于技术基础不同,最终呈现的识别率、准确度、识别速度也大有不同。易道博识坚持走自主产权道路,凭借大量的技术人才储备和持续不断的研发投入,拥有行业领先的核心产品技术,积累了大量的成熟产品。
易道博识的大多数OCR识别产品已经上架AI开放平台,目前已支持的产品列表包括:
通用文字、身份证、银行卡、行驶证、驾驶证、营业执照、增值税发票、港澳台通行证、广东省居住证、临时身份证、电子发票、火车票、出租车票、机动车发票、二手车发票、车辆合格证、车牌、行驶证副页、驾驶证副页、不动产登记证、房产证、银行支票、承兑汇票、开户许可证、北京市医疗发票等。