趣文网 > 作文大全

如何将图片文字变为可编辑文档——OCR

2020-12-01 07:40:01
相关推荐

当我们需要把电脑上的文档展示到纸面上时,操作非常简单,我们只需要点击下打印,就可以把文档成功印制到纸面上。但如今更多的工作需求是要将纸面上的信息传递到电脑上,其中一种方式便是拍照和扫描,可这种方式却无法帮助我们对图片上信息进行编辑处理,因此OCR技术应运而生。

Optical Character Recognition,光学字符识别技术,它是过光学仪器,如影像扫描仪、传真机或任何摄影器材,将需要处理的文档传递给计算机,再有计算机进行处理获得文字信息。

首先是图像处理,OCR软件先将图片进行分析,区分图形、表格及文字段落等部分,然后对不同内容进行不同方式来处理。其中,对于文字部分OCR软件会降噪,去除图像杂质,然后通过调整图片的灰阶、彩色,最终得到黑白两色的图片,方便计算机辨识。同时通过位置调整实现图形矫正,更清晰地展示出相关文字内容。

其次是进行文字特征处理,就是将提炼出的黑白色文字与文字库内的文字进行一一比对,找到样式最为接近的文字,确定单个文字内容。一个好的OCR软件会将一个文字区分成多个部分,并设定各部分特征,使得文字比对更加准确。

最后是数据库信息比对,这一步是将对应的字符从单个字到字段、字集上进行比对,通过语境、语义的对比,最终明确特征不明显字符。

OCR除了图像处理及数据比对技术,还应用了文字环境,人工智能等其他技术。虽然今天OCR的处理效果并不尽人意,但是随着处理能力及机器学习技术的不断发展,相信未来OCR一定可以更准确有效地处理各种文字字体。

阅读剩余内容
网友评论
相关内容
延伸阅读
小编推荐

大家都在看

描写放风筝的作文 失败的滋味作文 云南之旅作文 我为你喝彩作文 春风拂面作文 优美作文500字 写海景的作文 过年的作文200字 幸福的颜色作文 滑雪作文500字 我得到了表扬作文 校园生活作文400字 国庆节作文350 四年级上册作文题目 读书使我快乐作文 包粽子的过程作文 厚积薄发的作文 我和我的朋友英语作文 描写雪花的作文 作文题记摘抄大全 作文提纲例子 愧疚作文600字 阅读作文800字 打光屁屁作文 上善若水作文 我好想什么什么作文 最宝贵的财富作文 我被什么作文 我不再胆小作文 防侵性作文