0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉的实现基本过程

新机器视觉 ? 来源:新机器视觉 ? 2020-09-24 10:49 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如果想要机器能够进行思考,我们需要先教会它们去看。

李飞飞——Director of Stanford AI Lab and Stanford Vision Lab

计算机视觉(Computer vision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行仪器检测的图像。

学习和运算能让机器能够更好的理解图片环境,并且建立具有真正智能的视觉系统。当下环境中存在着大量的图片和视频内容,这些内容亟需学者们理解并在其中找出模式,来揭示那些我们以前不曾注意过的细节。计算机视觉的实现基本过程为:

计算机从图片中生成数学模型

计算机图形在模型中对图像进行绘制,然后在图像处理过程中将其作为输入,另外给出处理图像作为输出

计算机视觉的理念在某些方面其实与很多概念有部分重叠,包括:人工智能、数字图像处理、机器学习深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。因此,你可以将本文看成是深入这个领域研究的第一步。本文将尽量包涵到尽可能多的内容,但是可能仍然会存在一些较为复杂的主题,也有可能存在某些遗漏之处,敬请见谅。

丨第一步——背景

通常来说,你应该具有一点相关的学术背景,比如上过有关概率学、统计学、线性代数、微积分(微分与积分)等相关课程,对矩阵计算有一定了解更好。另外,从我的经验来看如果你对数字信号处理有了解的话,在以后对于概念的理解来说会更加容易。
在实现层面来说,你最好能够会用MATLAB或者Python中的一种,一定要记住的是计算机视觉几乎全部与计算机编程有关。

你也可以在Coursera上选修《概率绘图模型》一课,这门课程相对较难(讲得比较深入),你也可以在学习一段时间之后再对其进行了解。

丨第二步——数字图像处理

观看来自杜克大学的Guillermo Sapiro所教授的课程——《图像和视频处理:从火星到好莱坞Image and Video Processing: From Mars to Hollywood with a Stop at the Hospital》,该课程所提供的教学大纲每章都是独立的且包涵大量的练习,你可以在coursera和YouTube上找到相关的课程视频信息。另外你可以看下Gonzalez与Woods编写的《数字图像处理(Digital Image Processing)》一书,使用MATLAB来运行其中所提到的范例,相信一定会有所获。

丨第三步——计算机视觉

一旦学习完有关数字图像处理有关内容,接下来应该了解相关的数学模型在各种图像和视频内容中的应用方法。来自佛罗里达大学的Mubarak Shah教授在计算机视觉方面的课程可以作为一门很好的入门课程,其涵盖了几乎所有的基础概念。

观看这些影片的同时,可以学习Gatech的James Hays教授的计算机视觉项目课程所使用的概念和算法,这些练习也都是基于MATLAB的。千万不要跳过这些练习,只有在真正的练习过程中才会对这些算法和公式有更深入的了解。

丨第四步——高级计算机视觉

如果你认真学习了前三步中的内容,现在可以进入到高级计算机视觉相关学习了。
来自巴黎中央理工学院的Nikos Paragios和Pawan Kumar讲授了一门人工视觉中的离散推理(Discrete Inference in Artificial Vision)课程,它能提供相关的概率图形模型和计算机视觉相关的大量数学知识。

到现在这一步来看就比较有趣了,这门课程一定能让你感受到用简单模型构筑机器视觉系统有多么复杂。学完这门课程的话,在接触学术论文之前又迈进一大步。

丨第五步——引入Python和开源框架

这一步我们要接触到Python编程语言。
就Python而言有许多像 OpenCV、PIL、vlfeat这样的相关扩展包,现在就是将这些扩展包运用到你的项目中的最好时机。因为如果有其他的开源框架存在的话,没有必要从头开始来编写一切内容。
如果需要参考资料的话可以考虑《使用Python对计算机视觉进行编程 Programming Computer Vision with Python》,使用这本书就够了。你可以动手去尝试下,看看MATLAB和Python结合的话如何来实现你的算法。

丨第六步——机器学习与CovNets(卷积神经网络

有关如何从头开始机器学习的资料实在太多,你可以从在网上查找到大量相关教程

从现在开始最好一直使用Python进行编程,可以看下《使用Python建立机器学习系统——Building Machine Learning Systems with Python》和《Python机器学习——Python Machine Learning》这两本书。
目前深度学习正大行其道,可以试着学习卷积神经网络在计算机视觉中的应用( Computer Vision: the use of CovNets),在此推荐斯坦福的CS231n课程:针对视觉识别的卷积神经网络。

丨第七步——如何才能更进一步

行文至此,你可能会觉得已经讲了太多的内容,需要学的已经太多。但是,你还可以进一步进行探索研究。
其中一个方法是看看由多伦多大学的Sanja Fidler和James Hays所举行的一系列研讨会课程,能帮助你对当下计算机视觉研究方向的最新概念有所理解。
另一种即跟着 CVPR、ICCV、 ECCV、 BMVC这些顶级学术会议的相关学术论文,通过会上的研讨会、主旨演讲以及tutorial等日程一定能学到不少知识。

总结:如果你按照步骤一步步完成所有的学习任务,届时你将大概了解计算机视觉中有关滤波器、特征检测、描述、相机模型、追踪器的历史,另外还学习到分割和识别、神经网络和深度学习的最新进展。希望本文能帮助你在计算机视觉领域走得更远,学习得更加深入。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    27

    文章

    1328

    浏览量

    58184
  • 机器视觉
    +关注

    关注

    163

    文章

    4604

    浏览量

    123176
  • 计算机视觉
    +关注

    关注

    9

    文章

    1710

    浏览量

    46892

原文标题:从计算机视觉的小白变为大神,你需要经历这七个阶段

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 ?208次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 ?199次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b><b class='flag-5'>实现</b>智能视频分析

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    等多种应用中。然而,这些计算机视觉应用可能很难实现最优化的延迟性能和处理速度,特别是在内存大小、电池容量和处理能力有限的移动设备上难度更高。 而 Arm KleidiCV 便能在其中大显身手。该开源库利用了最新 Arm CPU
    的头像 发表于 02-24 10:15 ?612次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 ?1633次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    工业中使用哪种计算机

    在工业环境中,工控机被广泛使用。这些计算机的设计可承受极端温度、灰尘和振动等恶劣条件。它们比标准消费类计算机更耐用、更可靠。工业计算机可控制机器、监控流程并实时收集数据。其坚固的结构和专业功能
    的头像 发表于 11-29 14:07 ?756次阅读
    工业中使用哪种<b class='flag-5'>计算机</b>?

    量子计算机与普通计算机工作原理的区别

    ? 本文介绍了量子计算机与普通计算机工作原理的区别。 量子计算是一个新兴的研究领域,科学家们利用量子力学,制造出具有革命性能力的计算机。虽然现在的量子
    的头像 发表于 11-24 11:00 ?1608次阅读
    量子<b class='flag-5'>计算机</b>与普通<b class='flag-5'>计算机</b>工作原理的区别

    工业计算机类型介绍

    工业领域没有计算机的世界就像没有管弦乐队的交响乐,缺乏实现最佳性能所需的和谐和精确度。计算机彻底改变了工业的运作方式,将效率、准确性和创新推向了新的高度。事实上,根据最近在印度进行的一项研究
    的头像 发表于 11-04 15:56 ?710次阅读
    工业<b class='flag-5'>计算机</b>类型介绍

    ROM对计算机性能的影响

    是一种非易失性存储器,即使在断电的情况下也能保持数据不丢失。它通常用于存储固件,这些固件是计算机启动和运行操作系统所必需的。ROM的内容在制造过程中被写入,并且通常不能被用户更改。 ROM的类型 PROM(可编程ROM) :用户可以通过特殊的编程设备写
    的头像 发表于 11-04 10:31 ?1293次阅读

    【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

    ,帮我们做决定。整个过程就是为了让机器能看懂图像,然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗?人类依赖视觉,找辆汽车轻而易
    的头像 发表于 10-31 17:00 ?1302次阅读
    【小白入门必看】一文读懂深度学习<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>技术及学习路线

    计算机接口位于什么之间

    计算机接口是计算机硬件和软件之间、计算机与外部设备之间以及计算机各部件之间传输数据、控制信息和状态信息的硬件设备和软件程序。它在计算机系统中
    的头像 发表于 10-14 14:02 ?1401次阅读

    计算机系统的硬件组成和主要部件

    计算机系统的硬件组成是计算机运行的基础,它包含了多个关键部件,这些部件相互协作,共同实现计算机的各种功能。
    的头像 发表于 09-10 11:41 ?7215次阅读

    简述计算机总线的分类

    计算机总线作为计算机系统中连接各个功能部件的公共通信干线,其结构和分类对于理解计算机硬件系统的工作原理至关重要。以下是对计算机总线结构和分类的详细阐述,内容将涵盖总线的基本概念、内部结
    的头像 发表于 08-26 16:23 ?5309次阅读

    晶体管计算机和电子管计算机有什么区别

    晶体管计算机和电子管计算机作为计算机发展史上的两个重要阶段,它们在多个方面存在显著的区别。以下是对这两类计算机在硬件、性能、应用以及技术发展等方面区别的详细阐述。
    的头像 发表于 08-23 15:28 ?3750次阅读

    微处理器如何控制计算机系统

    微处理器,作为计算机系统的核心部件,承担着控制整个计算机系统运行的重要任务。它不仅是计算机的运算中心,还是控制中心,负责执行程序指令、处理数据以及协调计算机各部件之间的工作。以下将详细
    的头像 发表于 08-22 14:21 ?1010次阅读

    计算机视觉有哪些优缺点

    计算机视觉作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革,也带来了诸多优势,但同时也伴随着一些挑战和局限性。以下是对
    的头像 发表于 08-14 09:49 ?2123次阅读