0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度大脑5.0实现史上最大升级 发布远场语音交互芯片“鸿鹄”

Hf1h_BigDataDig ? 来源:yxw ? 2019-07-05 15:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“这是百度大脑历史上最具跨越性的升级。”

近日的百度开发者大会上,百度首席技术官王海峰正式发布百度大脑5.0,并在下午的百度大脑分论坛,公布了其在AI算法、计算架构和应用场景各方面的新进展。

提出流式多级的截断注意力模型SMLTA

升级后的百度大脑5.0更加强调AI技术的标准化、自动化和模块化。

百度语音技术部高级总监高亮介绍,识别方面,百度提出流式多级的截断注意力模型SMLTA,这是国际上首次实现局部注意力建模超越整句的注意力模型,也是国际上首次实现在线语音大规模使用注意力模型。

SMLTA在大幅提升识别速度的同时,也提高了识别准确率。在输入法有效产品相对准确率提升15%,音箱有效产品相对准确率提升20%。

合成方面,针对现阶段面临风格迁移、音色模拟和情感拟人的三大挑战,百度推出语音合成技术Meitron,可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时,不同要素可以任意组合,灵活的控制合成语音的风格。同时降低语言合成门槛,仅需20句话就可以制作一个人的专属声音。

发布针对远场语音交互打造的芯片——百度鸿鹄芯片

对于落地应用正在端侧呈现出巨大需求,百度大脑语音团队研发出一款针对远场语音交互打造的芯片——百度鸿鹄芯片。

鸿鹄芯片的设计遵循“软件定义芯片”的全新设计思路。该芯片采用双核HiFi4架构,2.8M大内存,台积电40nm工艺,在此硬件规格上,100mw左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力。同时,按照车规级标准打造使鸿鹄芯片可满足极严格的需求,将为车载语音交互,以及智能家居等场景带来更大想象力。鸿鹄芯片流片的同时,即实现了量产。

交互升级包含一体化人机交互系统和大场景物理世界交互系统。简单而言,一体化人机交互系统是人与机器、虚拟环境的自然交互与融合,该系统适用于实现AR特效的直播、小视频、特效小程序等场景,已应用于百度多款视频App。

大场景物理世界交互系统是将视觉定位与AR技术突破性结合,实现大范围的虚拟信息与物理世界的精准叠加,从而建立起AI时代全新的交互系统。目前,软硬件结合可以满足应用场景更高效的视觉计算,以及更低延时的体验,同时能保护数据隐私。百度视觉方面的软硬件结合主要聚焦于模型压缩平台PaddleSlim、多模态FaceID开发组件以及软硬件一体解决方案AI相机三部分。FaceID覆盖设备量已超1200万台。

视觉语义化平台更新至2.0

视觉语义化平台2.0更新了许多先进的感知技术,也让机器人技术实现新突破。

百度三维视觉首席科学家杨睿刚介绍,机器人就是一个智能体,除了感知技术,智能体需要决策和动作相关的技术,实现从环境感知到主动感知。目前,百度研究的智能体技术主要集中在自动驾驶Apollo、工程机械和服务机器人三大方面。

上午主论坛中王海峰现场与一只机械臂“茶博士”进行了互动对话,还完成了传统的长嘴壶倒茶工作,其背后依靠的正是服务机器人方案。

基于百度3D视觉,机器人可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,机械臂可以对工作空间进行碰撞检测,避开障碍物;实时规划运动后,可自动生成倒茶轨迹;随后,感知水流变化,,王海峰在演示过程中故意改变了茶杯位置,茶博士也准确识别出了相关位置并成功续茶。

迎接5G时代,发布新一代AI计算架构

百度大脑5.0不仅包含算法层面创新,在算力方面也实现重大突破。近年来,算法对算力需求增长近300,000倍,而芯片的计算性能仅提升30倍,两者之间存在巨大鸿沟。

百度副总裁侯震宇为现场观众分享了百度新一代AI计算架构。面对AI计算的挑战,需要能够从端到端来提供AI计算能力,这要求计算系统从旧有的对海量数据处理能力、对IO高峰值的追求,转变为满足AI训练功能方面IO密集、计算密集、通信密集的需求,和AI推理功能方面大吞吐和低延迟的需求。

侯震宇认为,面对即将到来的AI+5G时代,计算将无处不在。真正的计算会发生在设备(Device)、边缘(Edge)和云(Cloud)中,因而D-E-C场景将会是接下来需要重点研究的问题;与此同时,包括芯片之间、系统之间、设备之间的互相连接,将帮助不同场景中的计算连接在一起,产生更大的计算力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52734

    浏览量

    444034
  • 百度
    +关注

    关注

    9

    文章

    2342

    浏览量

    92568
  • 人工智能
    +关注

    关注

    1810

    文章

    49220

    浏览量

    251471
  • 智能语音
    +关注

    关注

    11

    文章

    808

    浏览量

    49632

原文标题:百度大脑5.0实现史上最大升级,发布远场语音交互芯片“鸿鹄”

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度地图重磅发布地图AI开放平台

    近日,在WGDC25全球时空智能大会上,百度地图重磅发布地图AI开放平台。百度地图深耕20年的数据能力、引擎能力与AI技术全面开放,向开发者深度开放四大核心能力和五大场景解决方案。
    的头像 发表于 05-26 11:26 ?724次阅读

    百度智能云两大基础设施再升级

    近日,在Create2025百度AI开发者大会上,沈抖分享了百度智能云在智能基础设施建设方面的最新成果,并在算力、模型及应用等方面发布一系列全新产品。
    的头像 发表于 04-30 10:20 ?445次阅读

    百度发布文心4.5 Turbo、X1 Turbo和多款AI应用

    近日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型,以及多款AI应用。王海峰现场详细解读了背后的技术。
    的头像 发表于 04-30 10:16 ?647次阅读

    上汽大众与百度地图达成战略合作

    近日,上海国际车展期间,百度地图与上汽大众举行科技X生态战略合作伙伴签约仪式,双方将基于百度领先的车道级地图产品,为上汽大众千万车主打造更安全、高效的智能化出行体验。上汽大众总经理陶海龙、百度副总裁尚国斌等出席签约仪式。
    的头像 发表于 04-29 17:28 ?624次阅读

    百度文心大模型将升级并开源

    百度近日宣布,其文心大模型系列将迎来新版本升级,计划在未来数月内逐步推出文心大模型4.5系列。这一消息无疑为AI领域注入了新的活力。 据悉,百度文心大模型4.5系列将在技术上进行全面优化,旨在为用户
    的头像 发表于 02-14 14:25 ?517次阅读

    百度智能云四款大模型应用接入DeepSeek

    近日,百度智能云旗下四款重量级大模型应用产品——客悦、曦灵、一见、甄知,正式迎来了全新升级,接入了先进的DeepSeek模型。这一重要更新,标志着百度智能云在为企业智能化转型提供更强动力方面迈出了坚实的一步。
    的头像 发表于 02-10 18:00 ?901次阅读

    百度科启动“繁星计划”

    近日,百度科携手中国科协、中国科学院大学共同举办了史记2024·科学科100词发布会,并在此盛会上正式启动了“繁星计划”。这一计划的核心目标在于利用前沿的AI技术,包括数字人、智能
    的头像 发表于 12-31 10:26 ?838次阅读

    百度进军短剧领域,计划全面升级平台

    近日,据天眼查知识产权信息显示,百度在线网络技术(北京)有限公司已经正式申请注册了“百度短剧”商标。该商标的国际分类涵盖了网站服务、科学仪器以及教育娱乐等多个领域,且当前商标状态均为等待实质审查
    的头像 发表于 12-19 10:25 ?764次阅读

    百度正式回应进军短剧领域

    近日,百度在线网络技术(北京)有限公司在知识产权领域有了新的动作,据天眼查信息显示,该公司已申请注册“百度短剧”商标,涵盖网站服务、科学仪器、教育娱乐等多个国际分类,目前这些商标均处于等待实质审查
    的头像 发表于 12-17 14:19 ?651次阅读

    百度Apollo开放平台10.0正式发布

    12月4日,百度正式发布Apollo开放平台的全新升级版本——Apollo开放平台10.0,基于自动驾驶大模型ADFM设计重构算法,助力全球开发者和企业以更低成本、更高性能、更安全的技术应用,研发
    的头像 发表于 12-04 16:20 ?1175次阅读

    百度发布AI创作新物种“自由画布”,吸引超20万人预约

    近日,百度文库与百度网盘携手推出的AI创作新物种——“自由画布”正式亮相,并宣布面向公众开放邀测。这一创新举措标志着百度在内容操作系统领域迈出了重要一步。 据悉,“自由画布”是百度文库
    的头像 发表于 11-14 13:45 ?1193次阅读

    百度发布AI智能眼镜

    近日,有知情人士透露,百度旗下的人工智能品牌小计划在即将举行的百度世界大会上推出一款全新的AI智能眼镜。这款眼镜将内置先进的人工智能助手,并配备摄像头,为用户提供前所未有的智能体验。
    的头像 发表于 11-11 14:50 ?989次阅读

    百度智能云发布千帆大模型平台3.0

    2024年百度云智大会上,百度智能云震撼发布千帆大模型平台3.0,标志着其在AI领域又一里程碑式的进步。新版平台不仅实现了全面升级,更交出了
    的头像 发表于 09-26 14:51 ?874次阅读

    百度舸AI计算平台4.0震撼发布

    在2024年百度云智大会的璀璨舞台上,百度智能云重磅推出了舸AI异构计算平台的全新力作——4.0版本。此次升级,标志着百度在AI基础设施领
    的头像 发表于 09-26 14:46 ?957次阅读

    百度文心一言APP升级为文小言

    百度宣布其文心一言APP正式升级为文小言,标志着百度在智能搜索领域迈出了重要一步。文小言作为百度旗下的“新搜索”智能助手,不仅集成了富媒体搜索、多模态输入等前沿技术,还创新性地推出了文
    的头像 发表于 09-04 16:06 ?1077次阅读