0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

以深度学习为核心的计算机视觉技术具有视觉美感吗

MZjJ_DIGITIMES ? 来源:cg ? 2018-12-21 11:07 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们看到了智能技术在影像辨识、侦测上的突破,甚至落地为产品。很多人问,这些深度学习为核心的计算机视觉技术也可以具有人类的美感—具有评判、编修、甚至美学创作的能力吗?

智能视觉美感技术大致可以区分为三类:首先为影像(或视讯)编修强化,包括修图(对比、亮度、景深等)、超高分辨率成像、突破压缩技术、改善电视显像质量、加速电影(内容)特效制作、甚至主动改善车辆安全驾驶在低亮度下的视讯质量;其次为照片美学评分、取景,自动挑选具美感的照片或是画面;第三为自动生成不存在的影像。而这些核心技术所启发的应用都已经是进行式,或是即将落地为产品。

相关技术大大改变数位内容产业。梵谷油画电影《梵谷:星夜之谜(Loving Vincent)》耗时6年,动员超过百位来自世界各地的画家才完成这个耗时、耗资的工作。目前已经有软件服务完成类似的功能,可以让一般人自动将影片转换为特定画家的风格,透过画家的经典创作,让卷积网络(CNN)的数千万个参数,学习到影像转换的方式,均衡风格跟影片内容。我们在两年前参与的IBM华生研究中心预告片自动剪辑研究,也同样带来类似产业的突破。

一般的卷积网络架构为设计适合的编码器以及相对的译码器;前者将画面内容解析之后,透过后者生成适切的影像(强化或是编修),大量的卷积网络参数透过事前的训练数据来达成目的。而时常被忽略的是适合的目标函数,通常得同时使用多个,并将领域知识吸纳其中,这是成功与否的重要关键!

在美学评分方面,一般利用卷积网络加上回归函式来逼近美感分数。最大的挑战在于训练的数据。因为严谨的美感牵涉到文化、社会、以及个人的差异,可以取得的训练数据─不管是透过人工标注或是社群网络下载—不全具代表性,很难学习到通用的美感。不过在特定家用照片上,透过自动评分,甚至修正照片(旋转、取景、饱和度等)等都已经落地在国内外的各种应用当中。如果能进一步熟悉应用场域,个人化适性学习,将有更大发挥的空间。

最具挑战的是从无到有生成具美感的影像,一般都尝试利用生成对抗网络(GAN)来实现,但是目前在速度、分辨率、生成质量控制上都还有相当努力的空间。

值得产业注意的是,我们观察到这些视觉美感智能突破也逐渐由云端走入本地端。相机、摄影机、电视等相关芯片都已经看到国内外的公司正逐渐布局。因为提供具美感的生活体验,不正也是智能时代的新产品吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1710

    浏览量

    46887
  • 深度学习
    +关注

    关注

    73

    文章

    5564

    浏览量

    122953

原文标题:【椽经阁】智能技术可以具有人类的视觉美感吗?

文章出处:【微信号:DIGITIMES,微信公众号:DIGITIMES】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 ?584次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    必须严谨,并定期重新校准。 OpenCV与ROS2的无缝结合 OpenCV是计算机视觉核心工具,书中介绍了如何在ROS2中调用OpenCV进行图像处理(如边缘检测、颜色空间转换等)。 通过ROS2
    发表于 05-03 19:41

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉模型。这将给诸多应用领域的机器学习开发人员
    的头像 发表于 03-11 15:11 ?425次阅读
    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉
    的头像 发表于 02-24 10:15 ?607次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 ?1631次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    【「具身智能机器人系统」阅读体验】+两本互为支持的书

    之极。 《计算机视觉之PyTorch数字图像处理》《具身智能机器人系统》提供了感知和识别能力,而《具身智能机器人系统》则为《计算机视觉之P
    发表于 01-01 15:50

    【小白入门必看】一文读懂深度学习计算机视觉技术学习路线

    一、什么是计算机视觉计算机视觉,其实就是教机器怎么像我们人一样,用摄像头看看周围的世界,然后理解它。比如说,它能认出这是个苹果,或者那边有辆车。除此之外,还能把拍到的照片或者视频转换
    的头像 发表于 10-31 17:00 ?1297次阅读
    【小白入门必看】一文读懂<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>及<b class='flag-5'>学习</b>路线

    AI干货补给站 | 深度学习与机器视觉的融合探索

    ,帮助从业者积累行业知识,推动工业视觉应用的快速落地。本期亮点预告本期将以“深度学习与机器视觉的融合探索”为主题,通过讲解深度
    的头像 发表于 10-29 08:04 ?603次阅读
    AI干货补给站 | <b class='flag-5'>深度</b><b class='flag-5'>学习</b>与机器<b class='flag-5'>视觉</b>的融合探索

    ARMxy嵌入式计算机在机器视觉中的卓越表现

    嵌入式视觉是指在嵌入式系统中使用计算机视觉技术,与经常所说的机器视觉系统的区别在于嵌入式视觉系统
    的头像 发表于 10-10 14:47 ?572次阅读
    ARMxy嵌入式<b class='flag-5'>计算机</b>在机器<b class='flag-5'>视觉</b>中的卓越表现

    立体视觉新手必看:英特尔? 实感? D421深度相机模组

    入门级立体深度模组,旨在高性价比将先进的深度感应技术带给更广泛的用户群体,寻求深度成像
    的头像 发表于 09-26 13:33 ?684次阅读
    立体<b class='flag-5'>视觉</b>新手必看:英特尔? 实感? D421<b class='flag-5'>深度</b>相机模组

    初创公司SEA.AI利用NVIDIA边缘AI和计算机视觉技术变革航海安全系统

    总部位于奥地利林茨的初创公司正在利用 NVIDIA 边缘 AI 和计算机视觉技术变革航海安全系统,让每一次出海变得更安全。
    的头像 发表于 09-09 09:32 ?963次阅读

    锐思智芯展示融合视觉感知技术创新与产品应用

    日前,计算机视觉和人工智能领域最具影响力的顶级学术会议——IEEE国际计算机视觉与模式识别会议(CVPR2024)在美国西雅图会议中心拉开帷幕。
    的头像 发表于 08-28 14:36 ?983次阅读

    ARMxy ARM嵌入式计算机搭载 1 TOPS NPU支持深度学习

    ARMxy ARM嵌入式计算机BL410系列内置了1TOPS算力 NPU,它每秒可以执行高达一万亿次的浮点运算,这复杂的图像处理和深度学习任务提供了充足的
    的头像 发表于 08-20 11:53 ?913次阅读
    ARMxy ARM嵌入式<b class='flag-5'>计算机</b>搭载 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>学习</b>

    计算机视觉有哪些优缺点

    计算机视觉作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革,也带来了诸多优势,但同时也伴随着一些挑战和局限
    的头像 发表于 08-14 09:49 ?2123次阅读

    图像处理器与计算机视觉有什么关系和区别

    图像处理器与计算机视觉是两个在图像处理领域紧密相连但又有所区别的概念。它们之间的关系和区别可以从多个维度进行探讨。
    的头像 发表于 08-14 09:36 ?1085次阅读