0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个多层机器学习程序的诞生

IEEE电气电子工程师 ? 来源:IEEE电气电子工程师学会 ? 作者:IEEE电气电子工程师 ? 2020-09-04 14:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

想象一下你正在看一部恐怖电影:女主角在一个黑暗的地下室里,高度警惕。背景中播放着悬疑的音乐,而一些看不见的,邪恶的生物在阴影中爬行……然后——砰!打到了一个物体。

如果没有强烈但恰到好处的音效,这样的场景很难有那么吸引人和恐怖。通常,这些音效是由工作室里的Foley艺术家录制的,他们使用大量可供选择的物体来产生声音。录制玻璃破碎的声音可能涉及实际反复打碎玻璃,例如,直到声音与视频剪辑非常匹配。

据悉,研究人员已经开发了一款自动化程序,可以分析视频帧中的运动,并创建自己的人工声音效果来匹配场景。在一项调查中,大多数被调查者表示他们相信这些假音效是真的。该模型名为AutoFoley,具体介绍发表在了6月25日出版的IEEE Transactions on Multimedia上面。

“自20世纪30年代以来,在后期制作中使用Foley艺术添加音效一直是电影和电视配乐的一个复杂部分,”参与创作AutoFoley的德克萨斯大学教授Jeff Prevost解释道。“如果没有一个真实的Foley配乐的控制层,,电影看起来既空洞又遥远。然而,Foley声音合成的过程也由此为电影的创作增加了大量的时间和成本。”

Prevost和他的博士生Sanchita Ghose被自动Foley系统的想法所吸引,开始创建了一个多层机器学习程序。他们创建了两种不同的模型,可以在第一步中使用,包括识别视频中的动作并确定合适的声音。

第一个机器学习模型从快速移动动作片段的帧中提取图像特征(如颜色和运动),以确定合适的声音效果。

第二个模型来分析对象在不同帧中的时间关系。通过使用关系推理来比较不同时间段的不同帧,第二个模型可以预测视频中发生的动作。

在最后一步,合成声音以匹配其中一个模型预测的活动或运动。Prevost和Ghose使用AutoFoley为1000个短片创建声音,这些短片捕捉了许多常见的动作,比如下雨、骑马和滴答作响的时钟

分析显示,毫不奇怪的是,AutoFoley最擅长于在不需要与视频完全一致的情况下(例如,倾盆大雨、噼啪作响的大火)发出声音。但是,当视觉场景包含随时间变化的随机动作(例如打字、雷雨)时,程序可能与视频不同步。

接下来,Prevost和Ghose调查了57名当地大学生,他们认为哪些电影片段包括了原声配乐。在评估第一个模型产生的声音时,73%的受访学生选择了合成的AutoFoley剪辑作为原始片段,而不是真正的原始声音片段。在评估第二个模型时,仍有66%的受访者选择了AutoFoley剪辑而不是原来的声音剪辑。

“我们的方法的一个局限性是需要分类的主题出现在整个视频帧序列中,”Prevost说,同时还指出AutoFoley目前依赖的Foley类别的数据集非常有限。不过,AutoFoley的专利仍处于早期阶段,但Prevost说这些限制将在未来的研究中得到解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135107

原文标题:又被AI骗了?人工智能欺骗人类相信合成的声音效果是真实的

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 ?421次阅读

    BP神经网络与深度学习的关系

    ),是多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度
    的头像 发表于 02-12 15:15 ?994次阅读

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习般指神经网络算法)是强大的工具,目前也非常
    的头像 发表于 12-30 09:16 ?1311次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 ?512次阅读

    zeta在机器学习中的应用 zeta的优缺点分析

    在探讨ZETA在机器学习中的应用以及ZETA的优缺点时,需要明确的是,ZETA词在不同领域可能有不同的含义和应用。以下是根据不同领域的ZETA进行的分析: 、ZETA在
    的头像 发表于 12-20 09:11 ?1274次阅读

    构建云原生机器学习平台流程

    构建云原生机器学习平台是复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 ?498次阅读

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的分支,它致力于研究如何让计算机能够理解、解释和生成人类语言。机器学习(Ma
    的头像 发表于 12-05 15:21 ?2126次阅读

    ASR和机器学习的关系

    自动语音识别(ASR)技术的发展直是人工智能领域的重要分支,它使得机器能够理解和处理人类语言。随着机器
    的头像 发表于 11-18 15:16 ?875次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智能数据分析技术的创新源之
    的头像 发表于 11-16 01:07 ?1077次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为种专门为深度学习
    的头像 发表于 11-15 09:19 ?1433次阅读

    eda在机器学习中的应用

    值和噪声数据。通过绘制箱线图、直方图和散点图,我们可以直观地看到数据中的异常值和分布情况。例如,如果数据集中的某个特征值远高于其他值,这可能是异常值,需要进
    的头像 发表于 11-13 10:42 ?1018次阅读

    使用机器学习和NVIDIA Jetson边缘AI和机器人平台打造机器人导盲犬

    Selin Alara Ornek 是名富有远见的高中生。她使用机器学习和 NVIDIA Jetson 边缘 AI 和机器人平台,为视障人士打造了
    的头像 发表于 11-08 10:05 ?873次阅读

    具身智能与机器学习的关系

    (如机器人、虚拟代理等)通过与物理世界或虚拟环境的交互来获得、发展和应用智能的能力。这种智能不仅包括认知和推理能力,还包括感知、运动控制和环境适应能力。具身智能强调智能体的身体和环境在智能发展中的重要性。 2. 机器学习的定义
    的头像 发表于 10-27 10:33 ?1186次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中很大的子集是机器学习——让算法从数据中学习
    发表于 10-24 17:22 ?3080次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    RISC-V如何支持不同的AI和机器学习框架和库?

    RISC-V如何支持不同的AI和机器学习框架和库?还请坛友们多多指教下。
    发表于 10-10 22:24