0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

盘点2018年计算机视觉领域技术突破

张康康 ? 2019-07-29 18:27 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

回顾2018年,是属于人工智能的一年,不论是Google、Facebook、Intel、阿里巴巴等通过产业布局进入人工智能领域的互联网企业,亦或如旷视科技Face++、极链科技Video++、优必选科技这样直接以人工智能起家的原生技术企业,都将AI注入到每个角落,掀起了一轮又一轮的技术高潮。

因而,除了NLP研究突破接连不断,CV领域同样精彩纷呈,伴随着各式各样落地应用如此接近人们的生活,技术也变得越发成熟。本文整理了在2018年,在CV技术领域取得的最主要的一些重大技术突破。


BigGAN发布

Ian Goodfellow在2014年设计了GAN,在之后的几年中,围绕这个概念产生了多种多样的应用程序。

其中,在ICLR 2019论文中出现的BigGAN,同样是一个GAN,只不过更强大,是拥有了更聪明的课程学习技巧的GAN,由它训练生成的图像连它自己都分辨不出真假,因为除非拿显微镜看,否则将无法判断该图像是否有任何问题,因而,它更被誉为史上最强的图像生成器。


在计算机图像研究史上,BigGAN带来的突破是划时代的,比如在ImageNet上进行128×128分辨率的训练后,它的IS得分能达到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小图之外,BigGAN还能直接在256×256、512×512的ImageNet数据上训练,生成更让人信服的样本。

英伟达Video-to-Video Synthesis

英伟达在2018年的收获颇丰,他们的研究焦点从标准的监督学习转向更具挑战性的机器学习,如半监督学习,领域适应,主动学习和生成模型等。其中,由英伟达在2018年末发布的最大成果之一便是视频到视频生成(Video-to-Video synthesis),它通过精心设计的发生器、鉴别器网络以及时空对抗物镜,合成高分辨率、照片级真实、时间一致的视频,实现了让AI更具物理意识,更强大,并能够推广到新的和看不见的更多场景。


因而,Video-to-Video Synthesis也被看作是在过去几年中,视频领域的一次重大突破,毕竟从静态框架转换为动态框架的难度是很大的,但机器训练却在尽量模拟预测视频将会发生的情景,通过给定的输入视频学习映射函数,产生仿真度极高的视频内容。

Fast.ai18分钟训练ImageNet

在普遍认知还停留在需要大量计算资源来执行适当的深度学习任务时,Fast.ai通过使用16个公共AWS云实例,每个配备8个NVIDIA V100 GPU,运行fast.ai和PyTorch,用18分钟在ImageNet上将图像分类模型训练到了93%的准确率,刷新了一个新的速度记录。


这是一个令人惊喜的结果,尤其在公共基础设施上训练ImageNet能达到这种准确性,并且比其专有TPU Pod群集上的谷歌DAWNBench记录快40%,运行成本仅约为40美元。这意味着一个关键的里程碑出现了,几乎所有人都可以在一个相当大的数据集上训练大规模神经网络。

除了这些重要的节点之外,2018年的计算机视觉技术也部署更多方面,不论是亚马逊发布Rekognition将计算机视觉置于开发人员、微软为OneDrive和SharePoint推出了新的AI服务、Google相册让我们的记忆变得可搜索、还是每个场景下都正在逐渐普及的AI人脸识别等等,计算机视觉正在逐步渗透到我们生活的每个部分。

最后,最值得注意的是,计算机视觉的市场增长几乎与其技术能力的增长是一样快的,预计到 2025年,计算机视觉领域会带来超过262亿美元的收益,因而在人工智能的未来里,计算机视觉一定是最有力的表现形式,并将随处可见。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35787

    浏览量

    282617
  • 计算机视觉
    +关注

    关注

    9

    文章

    1711

    浏览量

    46958
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 ?679次阅读

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对
    的头像 发表于 06-26 19:39 ?650次阅读
    NVIDIA驱动的现代超级<b class='flag-5'>计算机</b>如何<b class='flag-5'>突破</b>速度极限并推动科学发展

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉模型。这将给诸多应用领域的机器学习开发人员
    的头像 发表于 03-11 15:11 ?459次阅读
    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉
    的头像 发表于 02-24 10:15 ?649次阅读

    Quantinuum“Reimei”量子计算机在RIKEN正式运行

    )成功安装并全面投入运行。 此次合作中,RIKEN为“Reimei”量子计算机提供了世界级的基础设施,包括为其量身定制的设计、准备及交付工作。这一里程碑式的成就不仅标志着Quantinuum在量子计算领域的持续
    的头像 发表于 02-17 10:21 ?539次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 ?1675次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    荣誉时刻|杰和科技荣获深圳市计算机行业协会多个奖项

    20251月8日,深圳市计算机行业协会举办了2024度会员大会暨高峰论坛。杰和科技应邀出席会议,与行业精英、专家代表等共同探讨2025年计算机行业未来趋势。本次大会现场发布多项行业
    的头像 发表于 02-05 17:48 ?588次阅读
    荣誉时刻|杰和科技荣获深圳市<b class='flag-5'>计算机</b>行业协会多个奖项

    量子计算机与普通计算机工作原理的区别

    ? 本文介绍了量子计算机与普通计算机工作原理的区别。 量子计算是一个新兴的研究领域,科学家们利用量子力学,制造出具有革命性能力的计算机。虽然
    的头像 发表于 11-24 11:00 ?1700次阅读
    量子<b class='flag-5'>计算机</b>与普通<b class='flag-5'>计算机</b>工作原理的区别

    工业计算机类型介绍

    工业领域没有计算机的世界就像没有管弦乐队的交响乐,缺乏实现最佳性能所需的和谐和精确度。计算机彻底改变了工业的运作方式,将效率、准确性和创新推向了新的高度。事实上,根据最近在印度进行的一项研究
    的头像 发表于 11-04 15:56 ?732次阅读
    工业<b class='flag-5'>计算机</b>类型介绍

    【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

    一、什么是计算机视觉计算机视觉,其实就是教机器怎么像我们人一样,用摄像头看看周围的世界,然后理解它。比如说,它能认出这是个苹果,或者那边有辆车。除此之外,还能把拍到的照片或者视频转换
    的头像 发表于 10-31 17:00 ?1340次阅读
    【小白入门必看】一文读懂深度学习<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>及学习路线

    计算机接口位于什么之间

    计算机接口是计算机硬件和软件之间、计算机与外部设备之间以及计算机各部件之间传输数据、控制信息和状态信息的硬件设备和软件程序。它在计算机系统中
    的头像 发表于 10-14 14:02 ?1453次阅读

    计算机局域网技术是什么

    计算机局域网(Local Area Network,LAN)技术是指在较小的地理范围内(如一所学校、一个公司或一栋大楼内),将各种计算机、外部设备和数据库系统等通过特定的连接介质(如有线电缆、光纤或
    的头像 发表于 10-08 10:23 ?1047次阅读

    初创公司SEA.AI利用NVIDIA边缘AI和计算机视觉技术变革航海安全系统

    总部位于奥地利林茨的初创公司正在利用 NVIDIA 边缘 AI 和计算机视觉技术变革航海安全系统,让每一次出海变得更安全。
    的头像 发表于 09-09 09:32 ?990次阅读

    晶体管计算机和电子管计算机有什么区别

    晶体管计算机和电子管计算机作为计算机发展史上的两个重要阶段,它们在多个方面存在显著的区别。以下是对这两类计算机在硬件、性能、应用以及技术发展
    的头像 发表于 08-23 15:28 ?3844次阅读

    晶体管计算机的诞生和特点

    晶体管计算机的诞生标志着计算机技术的一个重要里程碑,它不仅推动了计算机硬件的革新,还促进了计算机软件技术的发展。以下是对晶体管计算机诞生及其
    的头像 发表于 08-23 15:06 ?4419次阅读