0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能伴侣虚拟机器人小冰的技术解读

电子工程师 ? 2018-06-17 22:25 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

三百六十行,行行出状元。在众多行业中有这么一个行业迎来了一位“新人”——微软小冰。

作为一款人工智能伴侣虚拟机器人的小冰,去了歌唱界。不仅发表个人单曲,还参与作词作曲,经历了五次迭代的微软小冰,现在已经成为一个会作曲会唱歌的全能型艺人。

▌作曲写诗写词样样精通

2017 年,微软出版了一本由小冰原创的诗集《阳光失了玻璃窗》,这是第一部 100% 由人工智能创造的诗集。在写诗之后,小冰还创作不同类型的文体,填词,唱歌,发表个人单曲等。

据介绍,小冰创作的基本原理有两大块,一块是他需要学习前人的作品,包括上千位诗人的诗集、上千万行歌词等等。第一步,训练深度神经网络的模型;第二步,有了一定的模型之后,需要给她一个触发源,工程师们称为创作冲动。

创作冲动有不同的方式,给出一张图片或文字,基于图片里的元素或文字内容的理解去创作,例如知乎上的海量回答,学习知乎预料大数据作为触发源,基于一个训练好的模型,生成对应的歌词。

值得注意的是,在小冰发布的单曲中,还听到有模拟真人呼吸的声音,据微软(亚洲)互联网工程院微软小冰首席语音科学家栾剑表示,主要是因为考虑到大众的习惯,没有换气可能会让人听着感觉很累,因为有些时候发烧友会跟着哼唱,没有呼吸换气的地方,会觉得不太舒服。

在技术上实现呼吸换气主要分为两个模块,第一个模块,首先要预测什么地方会有呼吸的声音,第二个模块,怎么样把呼吸的声音生成出来。

关于第一个,人类有两种呼吸,一个是这个歌到了一个休止符,在语意的地方需要一个停顿;还有一种,这首歌可能节奏很快,中间没有任何的停顿,这时候人类的歌手必须要在某个地方换一下气,不然的话,人类的肺活量支撑不了。

关于换气的声音,其实换气的声音有点类似于人类的声音,它就是一种没有声带振荡的声音,我们可以把他作一种中文语言系统以外的一种新的发言的因素去建模。

▌最早实现全双工对话

在 2016 年的 9 月份,微软小冰就开始真正的给人类打电话,到目前为止,打了超过 60 万通电话。在通话过程中会增加“嗯”、“啊”这样的语气词,给人的感觉更像真人,并且做到了全双工对话,可以互相打断,真正做到双方互动的聊天。

另外,小冰运用的领域是一个很开放的领域。她实际上跟用户在沟通的过程中话题,内容,都是可以双方提出来的。不仅是小冰抛出一个话题,就限定在这个话题里聊,而是随时可以根据对方抛出的新话题去聊。

据栾剑介绍,小冰这种开放领域的聊天难度上会更大一些。首先上下文大篇幅的语义理解在业界和学术界都是一个很难的课题,比如在写诗的时候,有时候的用词比较古怪,或者语句之间不太通顺,但实际上可能存在有一种潜在的逻辑。

也遇到了一个技术的瓶颈,语意理解像是一个黑盒子,这个黑盒子,会收入一些内容也会反馈一些内容,反馈的内容给人的感觉好像是理解了,但实际上他是不是真正理解了,是没有办法判断的。

人也是这样,在实际对话过程中,更多的是先给个输入,然后给个输出,再根据这个输出来判断他是不是真正理解了,但实际上这里面是有一定的套路存在的,你去判断他是不是理解,可能是很困难的,因为里面并没有一个那么直观的东西存在。

AI 的三个层次:运算智能、感知智能、认知智能

第一层,运算智能,像算盘一样;

第二层,感知智能,能够感知到一个物品是什么;现在大多数的 AI,包括语音、图象等还是停留感知智能层次上;

第三层,认知智能;像人一样,知道是什么,还知道为什么这样,还可以推理,这个层次较难。

说到底,AI 的创造力和人类的创造力之间有什么差别呢?

微软(亚洲)互联网工程院人工智能创造事业部副总经理袁晶表示,人的左脑更加偏向于计算;人的右脑是偏向创造力,发散思维,现在希望用计算的方式,让 AI 用左脑的方式去模拟右脑的行为。

换句话讲,这种创造在人里面只有顶尖的艺术家才能干,但是放到 AI 上,就相当于可以简化这个学习和训练的过程了。

相当于说,让她去拟合人类创作者的创作过程,并且能以这样的能力去帮助普通人去做一些创造,因为每个人都想去做一些创作的行为,只不过说限于自己的能力,AI 能够做到相当于他的助手,帮助普通人,享受创作的乐趣。比如她可以和你一起为你新出生的孩子、或你的恋人写首情诗,也可能为你爸爸的生日创作一首歌曲等。

▌未来小冰将尝试更多内容领域的创作

袁晶表示,未来会渐渐让小冰去尝试往内容生成的领域做一些探索,可能半年一年,很多别的公司或者机构,也会跟随这个趋势去做类似这样的事情。

在袁晶看来,人工智能在内容领域有一些新的能力或者突破可能将会是未来的一个方向,所以也会往这个方向不断的去做一些尝试,包括声音、文字、图像等三个方面,AI 未来会充当协助角色,帮助人类的创作者,去更好更快更高效的创作内容。

首先 AI 创造的成本是很低的,要比人类的创造成本低很多。比如读故事,当我们找配音员去读这个故事,他可能要付出一定的成本,但是如果声音的模型训练好了之后可以大批量的生成,成百上千个小时的大量的用户,所以他的成本会摊薄到很低。

小冰的声音技术里面增加了一些韵律和风格的变换,使得她可以去模仿人类创作者,在各种场景下面做各种不同的演艺。而机器人可以非常真实的模拟人声,让很多人有各种各样的顾虑。

栾剑表示,小冰声音的生成和使用的过程都是严格受控的,将来提供服务的时候,模型本身,以及合成的引擎本身,另外,小冰之前给人类打电话已经打了60万个,小冰都会先申明身份,明确告诉用户我们是微软小冰。微软设有专门的人工智能的委员会,防止人类利用人工智能技术去做伤害他人和社会的事情。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29939

    浏览量

    214424
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251548

原文标题:微软小冰作词又作曲,网友:要出道的节奏吗?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:23

    工业机器人工作站的建设意义

    在现代工业生产中,工业机器人工作站的建设已成为提升生产效率和产品质量的关键举措。随着自动化技术的不断发展,工业机器人工作站不再局限于单个机器人的作业,而是通过整合工装夹具、多台
    发表于 03-17 14:49

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破性的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    人工智能机器人技术和计算系统交叉领域感兴趣的读者来说不可或缺的书。这本书深入探讨了具身智能这一结合物理机器人
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数
    发表于 12-24 00:33

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    ,互联网行业占成熟经济体的GDP增长的21%,世界经济正面向数字经济转型的大趋势。具身智能机器人集成人工智能、高端制造、新材料等技术,其核心在于通过
    发表于 12-19 22:26

    从市场角度对机器人的基本解读

    人工智能机器人发展至今,几乎都是从学术方面对机器人进行定义诠释。现今机器人市场化发展程度已逐步进入多领域不同场景的融合应用,对实际市场已经可以发挥一定的使用价值。为更快的增强
    的头像 发表于 12-07 01:06 ?644次阅读
    从市场角度对<b class='flag-5'>机器人</b>的基本<b class='flag-5'>解读</b>

    人工智能机器人关节控制板BGA芯片底部填充用胶方案

    人工智能机器人关节控制板BGA芯片底部填充用胶方案方案提供商:汉思新材料人工智能机器人的广泛应用:随着人工智能技术的飞速进步,
    的头像 发表于 11-15 09:56 ?1021次阅读
    <b class='flag-5'>人工智能</b><b class='flag-5'>机器人</b>关节控制板BGA芯片底部填充用胶方案

    嵌入式和人工智能究竟是什么关系?

    嵌入式和人工智能究竟是什么关系? 嵌入式系统是一种特殊的系统,它通常被嵌入到其他设备或机器中,以实现特定功能。嵌入式系统具有非常强的适应性和灵活性,能够根据用户需求进行定制化设计。它广泛应用于各种
    发表于 11-14 16:39

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    探讨了人工智能如何通过技术创新推动能源科学的进步,为未来的可持续发展提供了强大的支持。 首先,书中通过深入浅出的语言,介绍了人工智能在能源领域的基本概念和技术原理。这使得我对
    发表于 10-14 09:27

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V和Arm内核及其定制的机器学习和浮点运算单元,用于处理复杂的人工智能图像处理任务。 四、未来发展趋势 随着人工智能技术的不断发展和普及,RISC-V在人工智能图像处理领域的
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    大力发展AI for Science的原因。 第2章从科学研究底层的理论模式与主要困境,以及人工智能三要素(数据、算法、算力)出发,对AI for Science的技术支撑进行解读。 第3章介绍了在
    发表于 09-09 13:54