0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

干货!一文读懂AI计算机视觉技术,“视觉五虎将”值得关注

AI机器人 ? 2018-09-21 09:47 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?

一、什么是计算机视觉?

计算机视觉,英文Computer Vision,简称CV。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。

二、计算机视觉和机器视觉有何区别?

事实上,二者经常会被混淆,甚至有些“专家”也没分清。

简单的说,二者最大的区别,在于技术要求的侧重点不一样,甚至差别很大。 计算机视觉(CV),主要是对质的分析,比如分类识别,这是一个杯子那是一条狗。或者做身份确认,比如人脸识别,车牌识别。或者做行为分析,比如人员入侵,徘徊,遗留物,人群聚集等。

机器视觉(MV),主要侧重对量的分析,比如通过视觉去测量一个零件的直径,一般来说,对准确度要求很高。

三、计算机视觉主要任务是什么?

计算机视觉的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的信息。计算机视觉任务的主要类型有以下几种:

1、物体检测

物体检测是视觉感知的第一步,也是计算机视觉的一个重要分支。物体检测的目标,就是用框去标出物体的位置,并给出物体的类别。

物体检测和图像分类不一样,检测侧重于物体的搜索,而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。

2、物体识别(狭义)

计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。

现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别、人脸识别、印刷或手写文件识别,或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。

3、图像分类

一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。

图像分类问题就是给输入图像分配标签的任务,这是计算机视觉的核心问题之一。这个过程往往与机器学习深度学习不可分割。

4、物体定位

如果说图像识别解决的是what,那么,物体定位解决的则是where的问题。利用计算视觉技术找到图像中某一目标物体在图像中的位置,即定位。

目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。

5、图像分割

在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如筛选特征点,或者分割一或多幅图片中含有特定目标的部分等。

图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。更精确地说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。

“图像语意分割”是一个像素级别的物体识别,即每个像素点都要判断它的类别。它和检测的区别是,物体检测是一个物体级别的,他只需要一个框,去框住物体的位置,而通常分割是比检测要更难的问题。

计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。

四、“视觉五虎将”都是谁?

目前在计算机视觉领域已经涌现出商汤科技、旷视科技、深兰科技、依图科技、云从科技等一批技术领先的独角兽公司,行业称为“视觉五虎将”,我们对这些公司作个简单介绍。

商汤科技:

公开资料显示,商汤科技成立于2014年11月,是中国一家计算机视觉和深度学习原创技术的创新型科技公司,也是一家知名独角兽企业,致力于引领人工智能核心“深度学习”的技术突破,构建人工智能、大数据分析行业解决方案。

目前,商汤科技已与众多知名战略合作伙伴和大客户建立合作,赋能AI于多个行业,迅速落地包括人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等各类应用技术。此外,商汤科技以人工智能技术服务于各大安防监控公司、银行金融机构、手机厂商、机器人厂商、多家移动APP厂商以及政府公安等客户。

旷视科技:

旷视科技成立于2011年10月,以深度学习和物联传感技术为核心,立足于自有原创深度学习算法引擎Brain++,深耕金融安全,城市安防,手机AR,商业物联,工业机器人五大核心行业。发展至今,旷视已在北京、西雅图、南京设立独立研究院,并在十余个核心城市设立分部。

旷视的核心人脸识别技术Face++曾被美国著名科技评论杂志《麻省理工科技评论》评定为2017全球十大前沿科技,同时公司入榜全球最聪明公司并位列第11名。在中国科技部火炬中心“独角兽”榜单中,旷视排在人工智能类首位。

深兰科技:

深兰科技,2014年由归国博士团队创建,致力于人工智能基础研究和应用开发。在全球拥有近百位全职博士和博士后学术带头人,几百位名校硕士研发人员,团队曾多次获得多项世界大赛和国内大赛奖项。团队利用自主知识产权的深度学习架构、机器视觉、生物智能识别等人工智能算法、无媒介支付等核心技术,在自动驾驶及整车制造、智能机器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育军工等领域都有深入布局,拥有包括英特尔在内6家人工智能联合实验室。

依图科技:

成立于2012年,公司核心业务包括智能安防平台、智慧健康医疗、城市数据大脑、智能硬件设备等。目前,依图的技术早已经服务全国20余省安防,为海关总署及中国边检等提供人像比对系统,并在招商银行、浦发银行,遗迹互联网金融等多个业务场景中广泛应用,车辆识别产品亦被公安系统广泛采用,依图也是目前国内唯一拥有10亿级人像库比对能力的公司,搭建了全球最大的人像系统,覆盖超过15亿人像。

云从科技

成立于2015年4月,是一家从中科院重庆研究院孵化的专注于计算机视觉与人工智能的高科技企业。是计算机视觉头部企业中的国家队,承建了国家发改委的基础项目重大工程——“人工智能基础资源公共服务平台”与产业化项目重大工程“人脸识别系统产业化应用平台”。与公安部、四大银行、证通、民航总局建立联合实验室,推动人工智能产品标准的建立,成为唯一同时制定国标、部标、行标的人工智能企业。国家发改委公布的《2017年“互联网+”重大工程拟支持项目名单》中包含四个AI公司,云从科技是其中唯一一家创业公司。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 ?680次阅读

    带你了解什么是机器视觉网卡

    机器视觉网卡通常指的是在机器视觉系统中用于连接工业相机到计算机的以太网卡。它的核心作用是实现高速、稳定、低延迟的图像数据传输。以下是关于机器视觉网卡的关键信息:1.核心功能:高速图像传
    的头像 发表于 07-09 16:18 ?221次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>带你了解什么是机器<b class='flag-5'>视觉</b>网卡

    带你了解工业计算机尺寸

    工业计算机是现代自动化、人工智能(AI)和边缘计算的支柱。这些坚固耐用的系统旨在承受恶劣的环境,同时为关键应用提供可靠的性能。然而,由于有这么多可用的外形尺寸,为您的工业计算机选择合适
    的头像 发表于 04-24 13:35 ?427次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>带你了解工业<b class='flag-5'>计算机</b>尺寸

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉模型。这将给诸多应用领域的机器学习开发人员
    的头像 发表于 03-11 15:11 ?459次阅读
    英飞凌边缘<b class='flag-5'>AI</b>平台通过Ultralytics YOLO模型增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的
    的头像 发表于 02-24 10:15 ?649次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 ?1677次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    AI干货补给站04 | 工业AI视觉检测项目实施第三步:模型构建

    在当今智能制造的浪潮中,AI视觉检测技术凭借其高效、精准的特性,已然成为提升产品质量和生产效率的重要工具。为了助力从业者更好地理解和实施AI视觉
    的头像 发表于 11-29 01:04 ?740次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>干货</b>补给站04 | 工业<b class='flag-5'>AI</b><b class='flag-5'>视觉</b>检测项目实施第三步:模型构建

    AI干货补给站03 | 工业AI视觉检测项目实施第二步:数据收集

    阿丘科技「AI干货补给站」推出系列文章——《工业AI视觉检测项目入门指南》,这系列内容将AI
    的头像 发表于 11-22 01:06 ?697次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>干货</b>补给站03 | 工业<b class='flag-5'>AI</b><b class='flag-5'>视觉</b>检测项目实施第二步:数据收集

    Rockchip SoC 赋能 AI视觉创新:推动智能设备的未来发展

    随着人工智能(AI)和计算机视觉技术不断推动各行各业的创新,Rockchip 已成为提供强大系统级芯片(SoC)解决方案的领先厂商。该公司已开发出多款集成
    的头像 发表于 11-05 18:02 ?1199次阅读
    Rockchip SoC 赋能 <b class='flag-5'>AI</b> 与<b class='flag-5'>视觉</b>创新:推动智能设备的未来发展

    【小白入门必看】读懂深度学习计算机视觉技术及学习路线

    、什么是计算机视觉计算机视觉,其实就是教机器怎么像我们人样,用摄像头看看周围的世界,然后理
    的头像 发表于 10-31 17:00 ?1340次阅读
    【小白入门必看】<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>读懂</b>深度学习<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>及学习路线

    AI干货补给站 | 深度学习与机器视觉的融合探索

    在智能制造的浪潮中,阿丘科技作为业界领先的工业AI视觉平台及解决方案提供商,始终致力于推动AI+机器视觉技术的革新与应用。为此,我们特别开设
    的头像 发表于 10-29 08:04 ?621次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>干货</b>补给站 | 深度学习与机器<b class='flag-5'>视觉</b>的融合探索

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 ?1029次阅读

    ARMxy嵌入式计算机在机器视觉中的卓越表现

    嵌入式视觉是指在嵌入式系统中使用计算机视觉技术,与经常所说的机器视觉系统的区别在于嵌入式视觉系统
    的头像 发表于 10-10 14:47 ?608次阅读
    ARMxy嵌入式<b class='flag-5'>计算机</b>在机器<b class='flag-5'>视觉</b>中的卓越表现

    初创公司SEA.AI利用NVIDIA边缘AI计算机视觉技术变革航海安全系统

    总部位于奥地利林茨的初创公司正在利用 NVIDIA 边缘 AI计算机视觉技术变革航海安全系统,让每次出海变得更安全。
    的头像 发表于 09-09 09:32 ?990次阅读

    锐思智芯展示融合视觉感知技术创新与产品应用

    日前,计算机视觉和人工智能领域最具影响力的顶级学术会议——IEEE国际计算机视觉与模式识别会议(CVPR2024)在美国西雅图会议中心拉开帷幕。
    的头像 发表于 08-28 14:36 ?1013次阅读