0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软黄学东:企业应用最后一个痛点是会议中的语音

DPVg_AI_era ? 来源:未知 ? 作者:胡薇 ? 2018-05-23 16:07 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨天下午,微软全球技术院士黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

在昨天的微软人工智能大会上,微软全球技术院士黄学东展示了微软多项语音、翻译等技术,微软Build大会上的“黑科技”全球首创AI会议系统再次被演示。

昨天下午,黄学东博士、微软大中华区副总裁兼市场营销及运营总经理康容、ROOBO CTO雷宇接受了包括新智元在内的媒体专访,详细解答了微软的语音技术、产品落地以及生态合作。

新智元根据现场速记进行整理,部分内容有删节。

黄学东:评价谷歌没有什么意思,微软的“全武功”最有意思

问:您一直关注语音技术,现在很多搜索引擎还是通过输入文字来进行交互,什么时候我们能够看到像语音识别或图像技术真正改变到搜索引擎现在的状况?

黄学东:搜索引擎现在很复杂,我做语音之前做过搜索引擎,后台要完全了解所有的文件内容和关键是字是什么东西,还要匹配用户意图,找到相应的文本,它也有很多人工智能深度学习的技术。

语音识别在现在的媒体阶段,是文本输入还是语音输入还是图像输入?基本上还是一个相对比较松的耦合。语音进步的主要标杆是把波形转换成文字,这个过程中中文字也可以有不同的选择,因为语音识别不是完全的准确,就像搜索引擎一样,有第一个好结果,有第二好结果、第三结果,把整个结果给搜索引擎,搜索引擎在搜索的时候可以搜索不仅仅是第一好的结果,而且把语音识别第二好的结果也考虑进去。现在工业界的状态基本上是这样。

问:麦克风阵列部分经常在语音识别场景下遇到噪音问题,微软可以解决这个问题吗?还是说未来我们可以有更好的方法?

黄学东:我们有麦克风阵列的核心技术,并且已经有长足的进步,在业界是领先的。再加上360度的摄像头,这两者的结合让会议“AI神器”达到了很高的高度。不管是讲了什么话,各方面的指标都上了一个台阶。今后,我们的前景非常非常乐观。

问:之前谷歌Duplex打电话号称已经通过了图灵测试,你对这个怎么评价?

黄学东:不敢评价。媒体上很多评价说他们在作假,很多人质疑谷歌,让谷歌发言人出来认证,他们不出来认证,也不说话。

微软会议“AI神器”在多人自由交谈的情况下能知道谁在说话,而且知道说了什么话,做了现场演示。不仅做了中文,还做了英文,这是我们要表达的微软在语音识别业界的领导地位,是全武功,那个武是武力的“武”,不是一二三四五的五。

所以说批评谷歌没有什么意思,我们的“全武功”最有意思。

不仅能支持全双工,而且能支持“全武功”

问:上午微软展示了人工智能的系统,有哪些东西是微软从底层基础研发到开放再到产品的生产制造?有哪些是把底层的技术开放给伙伴,他们基于平台和技术做产品的研发和人工智能应用产品?

黄学东:首先,这些是研究的演示,微软从来不预先宣布我们产品什么时候出来、以什么方式出来。我们产品有几个东西可以讲,第一是我们的认知服务,语音这一部分云的API、模型、服务,有一套新的规律,这是在微软Build大会上已经宣布了的。

第二是定制服务增加了语音合成,想要换成自己想要听的声音,可以上传三个小时、十个小时,越多质量越好,可以定制到你想要的声音。所以我们全线语音和翻译都实现了量身定制。

现在如果你是开发商要开发自己的音箱,可以用微软刚刚推出来的MSDDK,这是我们和ROOBO合作推出来的一个最新解决方案,不仅仅有微软和ROOBO合作推出来的硬件,而且有最新的麦克风阵列,包括四麦线性的和七麦原型的麦克风阵列。这个黑科技是绝对引导业界潮流的,我们不仅能支持全双工,而且能支持“全武功”。

康容:我补充一下,因为微软是一个平台和工具的企业,我们是提供平台和工具,我们的黑科技、研发团队、我们的大咖博士发明的东西,他们渐渐的会落地到我们自己的产品中,也会提供给我们的生态合作伙伴让他们来开发。

微软大中华区副总裁兼市场营销及运营总经理康容

今天早上看到哪一个黑科技会在什么时候落地,很难讲出来,但是迟早会发生。我们会尽快的落地,我们会看市场的需求。所以,我们听到越多的客户和合作伙伴的声音,我们就会加速某某功能尽量落地。我们一系列的很多新东西都会提供给生态一起来合作。

问:ROOBO本身是针对不同的应用场景解决人工智能软硬结合方案的设计,然后去生产销售,过去这几年做这种场景化的人工智能设计,然后再去推广。人工智能产品怎么更成功的被市场接受,让消费者更容易去掏钱买?如何落地和激活?为什么这次和微软合作语音的开发及机会在哪里?微软的技术怎么独特的激活这个市场?

雷宇:其实这两个问题是一个问题。我们知道AI落地没有一个通用AI可以应用到每个垂直领域,这里面最核心的问题是如何产品化。

康容与雷宇(右)

在我们创业过程中我们发现,所有的方案只考虑技术,不考虑内容和服务。这在本质上违反了市场原则,用户永远要的是服务和功能,我觉得技术只是提升它的体验,我觉得这是一个本质的问题。

我们的痛点是在通用AI技术上,没有达到我们满意的效果,所以我们需要和国际上最顶尖的公司进行合作。

微软认知服务是全面性,微软服务本身也是有机体,本身考虑的就很完善。我们和微软的合作,因为我们看到了“明天”的东西,可以少走一些弯路,多模态和多场景的东西必然带来很大的变革。

企业应用最后一个痛点:会议中的语音

问:微软开发出了很好的语音识别等的技术,你们打算用这些技术开发出一些什么样的产品?智能音箱有很多企业都在做,但是具体的有没有什么更好的应用可以为大家更好的服务呢?

黄学东:语音交互过程中,在所有的商业场景中,用电子邮件、微信等等其他的产品都已经数字化了,会议中的语音是现在没有数字化的一个主要媒体,这对生产力的提高、对消费的提高是最后的痛点。在企业的应用中,最后的一个痛点就在这个地方。

会议比较难做,不像全双工,只有两个人在讲话,超过三个人的会议就比两个人会议难很多。如果能做到七八个人开会,都可以转录和翻译,可以变成数字化的形式处理。

问:如何看待目前的人工智能市场?

黄学东:我觉得人工智能造就的“饼”足够大,传统公司和新生公司都可以在这个饼上发挥自己的空间,为用户提供更优质的服务。微软云是提供全球很宽泛的一个平台,它的覆盖力不管是全球语言还是数据中心的覆盖力都应该是引导潮流的。在这样一个平台上,微软的从计算机视觉到自然语言处理,再到语音和搜索、知识表达等服务,都是业界领导潮流的。

所以在这个平台上和人工智能的深度上微软有非常大的优势,所以我们希望在提供这个宽度和深度这样的架构下,有更多的开发商可以在这个平台上开发出我们还没有想到的应用,这个才是平台做的事情。大家要知道微软有广度且有深度,这个情况下开发商应该加入这个平台,在上面创造他们新的价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6692

    浏览量

    106153
  • 人工智能
    +关注

    关注

    1810

    文章

    49220

    浏览量

    251473

原文标题:黄学东:微软“全武功”解决企业会议的痛点

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    盘古信息新能源行业解决方案:破解智造,引领绿色转型

    在全球大力倡导可持续发展的时代背景下,新能源制造行业蓬勃发展,成为推动经济绿色转型的重要力量。然而,随着行业的快速扩张,系列逐渐浮现,制约着企业的进
    的头像 发表于 07-29 09:27 ?156次阅读

    生产线回溯追溯系统选型:设智控方案如何破解行业

    设智控产线回溯追溯方案,从硬件到功能,精准破解行业,为电子制造、新能源等行业提供高效、可靠的生产管理工具,助力企业实现智能化生产升级,值得选型参考。
    的头像 发表于 07-18 11:19 ?427次阅读
    生产线回溯追溯系统选型:<b class='flag-5'>中</b>设智控方案如何破解行业<b class='flag-5'>痛</b><b class='flag-5'>点</b>?

    鸿无线计量方案:开启物联网新时代

    物联网无线计量正破局传统!?鸿电子?SDM630/SDM230-WiFi 智能电表,以实时、高效、易安装的优势,驱动能源与工业智能化转型。
    的头像 发表于 07-11 13:30 ?149次阅读

    微软移国际共话企业出海新篇章

    在日前举办的微软创想未来峰会上,场关于“智能体浪潮下重塑全球商业版图”的高峰对话吸引了业界目光。本次对话由微软大中华区副总裁、生态伙伴事业部总经理庆雪辉主持,特邀微软大中华区数字原生
    的头像 发表于 06-26 14:40 ?519次阅读

    芯资讯|告别烧录器!WT2605C语音芯片实现存储介质自由互拷

    在共享设备语音更新、电梯广告机内容轮播等场景,工程师常面临两大语音更新需拆机烧录,多设备同步效率低下。而广州唯创电子WT2605C
    的头像 发表于 06-04 09:06 ?296次阅读
    芯资讯|告别烧录器!WT2605C<b class='flag-5'>语音</b>芯片实现存储介质自由互拷

    厂家芯资讯|广州唯创电子WT2000T语音芯片智能会议录音笔IC应用介绍

    在快节奏的现代商业环境会议企业决策、创意碰撞和战略部署的核心场景。然而,传统会议记录方式常面临效率低、信息遗漏、回溯困难等
    的头像 发表于 05-07 08:42 ?279次阅读
    厂家芯资讯|广州唯创电子WT2000T<b class='flag-5'>语音</b>芯片智能<b class='flag-5'>会议</b>录音笔IC应用介绍

    语音芯片技术赋能:体化方案重塑爬玩具低成本开发新范式 ——以WT588F02B-C014为核心的超省BOM成本方案解

    、引言:智能化趋势下的爬玩具开发挑战随着早教理念的普及,爬玩具作为婴幼儿早期运动能力开发的重要工具,市场需求持续增长。然而,传统爬玩具开发面临多重挑战:需集成红外遥控、
    的头像 发表于 04-16 08:43 ?266次阅读
    <b class='flag-5'>语音</b>芯片技术赋能:<b class='flag-5'>一</b>体化方案重塑<b class='flag-5'>学</b>爬玩具低成本开发新范式 ——以WT588F02B-C014为核心的超省BOM成本方案解

    雷曼智慧会议交互系统助力企业打造数智化会议

    在Deepseek等AI大模型掀起认知智能浪潮的当下,企业会议场景正迎来新的变革。雷曼智慧会议交互系统(简称“雷曼会议体机”)将前沿AI大
    的头像 发表于 03-19 15:50 ?424次阅读

    武汉特高压串联谐振如何突破行业三大

    ? 、行业与用户需求 ? 传统方案缺陷 武汉特高压解决方案 设备笨重,搬运困难 电抗器数量多,总重超10吨 轻量化设计,总重降低
    的头像 发表于 02-27 13:35 ?348次阅读
    武汉特高压串联谐振如何突破行业三大<b class='flag-5'>痛</b><b class='flag-5'>点</b>?

    应急救援的:大核桃单北斗防爆手持终端如何成为破局者?

    在应急救援的紧张与紧迫,每秒都至关重要。然而,传统的应急通讯设备往往面临诸多挑战,从定位不准确到通信不稳定,再到功能单,这些问题都极大地限制了救援工作的效率与安全性。面对这些
    的头像 发表于 01-14 17:24 ?518次阅读
    应急救援的<b class='flag-5'>痛</b><b class='flag-5'>点</b>:大核桃单北斗防爆手持终端如何成为破局者?

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:35 ?656次阅读

    标贝智能语音识别在智能会议场景的落地案例

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:31 ?811次阅读
    标贝智能<b class='flag-5'>语音</b>识别在智能<b class='flag-5'>会议</b>场景<b class='flag-5'>中</b>的落地案例

    精准高效,讯维智能语音转写系统打造智慧会议新体验!

    在快节奏的现代工作环境会议已成为企业沟通、决策和协作不可或缺的部分。然而,传统会议记录方式往往存在效率低下、信息遗漏、人力成本高等问题
    的头像 发表于 11-15 15:27 ?1127次阅读
    精准高效,讯维智能<b class='flag-5'>语音</b>转写系统打造智慧<b class='flag-5'>会议</b>新体验!

    828 企业效率再升级,华为云会议 Flexus 版创新云会议体验!

    积累和华为云原生的公有云架构,为中小企业量身打造了整套高效、安全、智能的云视频会议解决方案——华为云会议 Flexus 版。 快速部署即开即用 在快节奏的商业环境
    的头像 发表于 11-15 15:21 ?631次阅读
    828 <b class='flag-5'>企业</b>效率再升级,华为云<b class='flag-5'>会议</b> Flexus 版创新云<b class='flag-5'>会议</b>体验!

    微软Copilot Studio将支持企业创建自主AI代理

    近日,微软宣布了项重要进展:下个月,企业将在Copilot Studio拥有创建自主AI代理的能力。这消息标志着
    的头像 发表于 10-23 11:44 ?695次阅读