0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OCR识别技术

新机器视觉 ? 来源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在爬虫对验证码进行破解时,经常需要对图片中的文字内容进行识别,这时就需要用到OCR技术了,那么 OCR识别技术是如何实现对文字内容“即拍即得”的呢?

OCR(Optical Character Recognition)即光学字符识别技术,实质属于计算机输入技术。OCR通过利用光学技术与计算机技术对图片、纸张、物体等处的文本内容进行分析识别,并读取转换成计算机和人类都能理解接受的格式。

OCR主要可以分为手写体识别和印刷体识别。

由于印刷体都是计算机自助生成再进行输出,通常较为规律,因此较手写体识别来说要更简单。而手写体由于往往会带有个人特色,每个人的风格不尽相同,由于其千人千面的特性,手写体识别也成了OCR界一直想攻克的难关。当然,除了手写体与印刷体外,OCR也可以根据识别内容来分类。例如按语言分类,要识别的内容将可能包括汉语、英语、日语、法语等,而如果仅满足国人需求,要识别的内容就可能会包括汉字、英文字母、阿拉伯数字、标点符号等。

通常根据要识别的内容不同,识别的难度也不同。比如仅识别阿拉伯数字,只需能识别出0-9,而英文字母则需要识别52个字符(仅考虑大小写),而中文识别则会高达数千个,且由于汉字的结构偏旁较为复杂,要将这些字符都准确识别出来会使难度系数直线上升。一个典型的OCR技术处理流程如下图所示:

图:来源于网络

其中,图像预处理通常为能使图像中的文字更明显便于识别,会对图像的成像问题进行修正,通常是基于数字图像处理和传统机器学习等方法对图像进行操作。

常见的图像预处理包括几何变换(透视、翻转、旋转、扭曲、拉直等)、畸变矫正、去模糊、锐化、图像增强、光线矫正、灰度化、二值化等。其中,在对付验证码时常用的灰度化、二值化处理对于内容较为简单的文本信息有增强作用,但对复杂背景的内容处理效果就会收效甚微。

文字检测,顾名思义是对图片中存在的文字内容进行检测,检测内容包括文本所在的位置、范围、布局、数量等,通常也包括整体版面分析和文字行检测等。部分OCR软件为了保证检测范围的准确性,还会套用图像检测的方法,对图像中的文本区域进行框选,并像下图所示将框选与待识别区域交由令用户进行校验确认。

图:某OCR软件识别界面

文本检测完成后,建立在其基础之上的文本识别将会对选定的文本内容进行识别,并将图像中的字符转化为可供人类和计算机识别的文本信息。文本信息主要需要解决的问题是每个字符是什么。

对于识别后输出的文本通常需要再次核对验证以确保其准确率,即文本校正,通常也被认为属于文字检测的环节。当识别的内容是由词库中的词汇构成时就称之为有词典识别,反之则称为无词典识别。在整个处理流程过程中,对识别准确率影响最大的步骤就是文本检测与文本识别。相比一般文本,通常对OCR技术的评测会从最终识别率、识别速度、版面理解正确率、版面还原满意度4方面来作为依据。

OCR识别技术对于手写体识别目前尚在发展阶段,而对于印刷体识别的技术已经发展的较为纯熟。而且,对于印刷体识别的应用划分可能远比你我想象的更为细致。例如用于对人身份进行核查验证的证件OCR识别、用于移动支付绑卡的银行卡OCR识别、用于存储管理名片的名片OCR识别、用于大量文字资料、档案卷宗的录入和处理的文档OCR识别、用于银行、金融、电信机构的票据OCR识别、用于交通安全的车辆OCR识别等。

OCR技术的出现无疑提升了工作效率,也改变了我们的生活。

参考文献:

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OCR
    OCR
    +关注

    关注

    0

    文章

    163

    浏览量

    16860

原文标题:文字识别界的“拍立得”——OCR识别技术

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何利用OCR技术实现高效集装箱箱号识别

    在现代物流和海关监管领域,快速准确地识别集装箱箱号是提升通关效率、降低运营成本的关键。OCR(光学字符识别技术的应用,为这一需求提供了智能化解决方案。通过结合高清成像设备和先进的算法
    的头像 发表于 08-12 10:48 ?132次阅读
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技术</b>实现高效集装箱箱号<b class='flag-5'>识别</b>?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0,为什么?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0
    发表于 07-23 08:11

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    获取图片url,把这个url和token再发给百度的ocr接口获取识别数据……或者图片转base64以后把这个base64发给接口,然而鸿蒙这里,目前我也不知道啥原因(可能是发送请求的数据长度有限
    发表于 06-30 18:07

    OCR技术如何实现铁路集装箱号的自动识别

    在铁路物流运输中,集装箱号的快速准确识别是提升效率的关键环节。通过先进的OCR(光学字符识别技术,结合计算机视觉与深度学习方法,可以实现铁路集装箱号的高效、可靠
    的头像 发表于 06-13 10:32 ?256次阅读

    OCR技术vs传统识别:哪种更适合火车集装箱识别

    在铁路物流领域,集装箱箱号识别是提升运输效率的关键环节。随着计算机视觉技术的发展,OCR识别与传统识别
    的头像 发表于 06-11 10:54 ?281次阅读

    明治案例 | 150个/分钟!电阻【OCR识别】+【尺寸测量】一步到位

    真实案例——看明治传感如何用一个视觉传感器,同时搞定电阻的尺寸测量和OCR识别,让质检效率翻倍,成本直降!场景需求希望在同一工位完成尺寸测量与OCR识别,减少设备占
    的头像 发表于 06-10 07:33 ?336次阅读
    明治案例 | 150个/分钟!电阻【<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>】+【尺寸测量】一步到位

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr
    发表于 05-28 06:46

    大模型预标注和自动化标注在OCR标注场景的应用

    OCR,即光学字符识别,简单来说就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。在数字化时代,OCR(光学字符
    的头像 发表于 04-15 15:18 ?496次阅读

    阿普奇视觉控制器AK7在OCR识别场景中的应用

    在实际工业生产中,OCR(光学字符识别技术的应用逐渐普及,在食品包装、新能源、汽车制造、3C电子等领域帮助企业完成产品编码、生产日期、批号等字符信息自动识别,对于避免因出现瑕疵、错漏
    的头像 发表于 03-20 11:44 ?291次阅读
    阿普奇视觉控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>场景中的应用

    汉王科技CES展示创新技术,共触未来智能交互

    独特的磁容触控技术,为用户带来了更加流畅、精准的交互体验。同时,汉王科技还推出了Penstar海外电纸本品牌,展示了其在电子纸技术领域的最新成果。 此外,汉王科技还带来了数字签批、手写&OCR
    的头像 发表于 01-08 15:08 ?731次阅读

    ElfBoard开源项目|车牌识别项目技术文档

    车牌识别项目基于百度智能云平台,旨在利用其强大的OCR服务实现车牌号码的自动识别。选择百度智能云的原因是其高效的API接口和稳定的服务质量,能够帮助开发者快速实现车牌识别应用。这个开源
    的头像 发表于 12-06 10:30 ?742次阅读
    ElfBoard开源项目|车牌<b class='flag-5'>识别</b>项目<b class='flag-5'>技术</b>文档

    光学字符识别是什么的一种技术

    光学字符识别(Optical Character Recognition,简称OCR)是一种将文本资料转换为计算机可编辑和可搜索的数据格式的技术。这项技术广泛应用于文档扫描、数据录入、
    的头像 发表于 09-10 15:48 ?1261次阅读

    光学识别技术的工作原理是什么?

    光学识别技术(Optical Character Recognition,简称OCR)是一种将图像中的文字信息转换成可编辑和可搜索的文本数据的技术。它广泛应用于文档扫描、数据录入、自动
    的头像 发表于 09-10 15:46 ?1477次阅读

    光学识别字符是自动识别技术

    光学识别字符(Optical Character Recognition,简称OCR)是一种自动识别技术,它能够将各种类型文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文
    的头像 发表于 09-10 15:43 ?933次阅读