0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

商汤科技SenseTime ? 来源:未知 ? 2023-06-22 06:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR 2023闪亮的成绩单。6月18日-22日,全球计算机视觉盛会CVPR 2023(Computer Vision and Pattern Recognition)在加拿大温哥华举行。

本届CVPR论文投稿总量达9155篇,最终共有2369篇论文被接收。最佳论文候选为12篇,接收率仅为0.13%。商汤及联合实验室2篇论文登上最佳论文候选名单(Award Candidate),其中自动驾驶研究论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)斩获本届CVPR最佳论文奖(Best Paper Award)

这是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 标志着自动驾驶技术的重要突破, 为自动驾驶技术与产业的发展提出了新的方向。

CVPR 2023最佳论文,自动驾驶研究获重要突破 自动驾驶技术高度复杂,需要融合多学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。自动驾驶还需要适应不同的道路规则和交通文化,与车辆和行人进行良好交互,以实现高度可靠和安全的自动驾驶系统。

大部分自动驾驶相关的工作都聚焦在具体的某个模块,关于框架性的研讨则相对匮乏。

商汤及联合实验室CVPR 2023 Best Paper提出的自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于Transformer 的端到端网络框架下,更高效契合了“多任务”和“高性能”的特点,取得自动驾驶技术研究重要突破。

623268e6-1080-11ee-962d-dac502259ad0.jpg自动驾驶UniAD框架对比(a)模块化(b)多任务模块(c)端到端自动驾驶模块

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,UniAD是业内首个感知决策一体化的端到端自动驾驶解决方案,并且整体系统和性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。

端到端的优化在多项关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。

625cb90c-1080-11ee-962d-dac502259ad0.jpg点击可查看高清图

UniAD 是一项极具创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。

随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来能推动实现更高阶的自动驾驶人工智能

CVPR 2023最佳论文候选,加速推动AIGC时代真实感3D内容生成

面向真实 3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题。由于缺乏大规模的真实扫描三维数据库,最近在三维物体建模方面的进展大多依赖于合成数据集。

为促进现实世界中3D感知、重建和生成的发展,商汤及联合实验室CVPR 2023 Best Paper候选论文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一个具有大规模高质量真实扫描3D物体的大型词汇3D物体数据集,覆盖近200个类别、约6000个三维物体数据,包括高精表面网格、点云、多视角渲染图像和实景采集的视频,借助专业扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D是目前学界最大的真实世界三维扫描模型数据集,为未来三维视觉研究提供了广阔空间。

利用该数据集,研究人员精心探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,验证其从感知、重建、到生成领域的开放应用前景,有望在AIGC 时代推动真实感3D生成方面发挥至关重要的作用。 持续引领前沿创新,是商汤在以大装置SenseCore和大模型为核心的AI基础设施领域长期投入,并坚持产学研协同创新的成果。

王晓刚教授认为,在大算力、大数据的支撑下,大模型将以更强大的通用能力引发人工智能领域的巨大变革,同时也会拓展我们的研究视野,激发新一轮研究范式革新。

自今年4月初“商汤日日新SenseNova”大模型体系公布以来,商汤的大模型已在气象预报、遥感解译、开放环境中的决策问题等领域取得了诸多突破性成就。未来,商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。

62a784e6-1080-11ee-962d-dac502259ad0.gif

相关阅读,戳这里

《CVPR 2022丨商汤再创佳绩,用技术创新直击行业痛点》

62c2e84e-1080-11ee-962d-dac502259ad0.jpg


原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    575

    浏览量

    36915

原文标题:创造历史!商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ALVA技术重塑工业智能感知决策边界

    无论是西门子构建的工业 AI 交易中心,还是微软推出的工厂运营智能,其本质都在验证个趋势——工业智能的核心竞争力,正从单
    的头像 发表于 07-22 14:32 ?1086次阅读

    自动驾驶中常提的世界模型是个啥?

    种对外部环境进行抽象和建模的技术,让自动驾驶系统在个简洁的内部“缩影”里,对真实世界进行描述与预测,从而为感知决策和规划等关键环节提供有力支持。 什么是世界
    的头像 发表于 06-24 08:53 ?232次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    感知层、传输层、应用层一体化:工控一体机厂家聚徽详解集成技术方案

    在工业 4.0 和智能制造蓬勃发展的时代浪潮中,工控一体机作为工业自动化领域的核心设备,正发挥着越来越关键的作用。它集感知、传输、处理与应用等多种功能于一体,通过高度集成化的技术方案,
    的头像 发表于 05-27 14:35 ?338次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    焦点是否落在目标物体上。某自动驾驶公司借此发现模型在夜间过度关注路灯而非行人。 ? 实时性保障: ?时间感知测试框架(TAF)注入时间戳探针,监控函数执行耗时。例如,某路径规划算法因内存泄漏导致响应
    发表于 05-12 15:59

    模型如何推动自动驾驶技术革新?

    [首发于智驾最前沿微信公众号]近年来,人工智能技术正以前所未有的速度在各个领域渗透与应用,而大模型(大语言模型和多模态大模型)的迅猛发展为自动驾驶技术带来了新的机遇。传统的
    的头像 发表于 04-20 13:16 ?344次阅读
    大<b class='flag-5'>模型</b>如何推动<b class='flag-5'>自动驾驶</b>技术革新?

    商汤科技与麒麟软件推出全国产办公智能助手一体机解决方案

    在4月10日的商汤技术交流日上,商汤科技联合麒麟软件正式推出基于商汤日日新V6大模型和银河麒麟智
    的头像 发表于 04-15 16:48 ?578次阅读

    自动驾驶中基于规则的决策和端到端大模型有何区别?

    自动驾驶架构的选择上,也经历了从感知决策控制、执行的三段式架构到现在火热的端到端大模型,尤其是在2024年特斯拉推出FSD V12后,各
    的头像 发表于 04-13 09:38 ?3038次阅读
    <b class='flag-5'>自动驾驶</b>中基于规则的<b class='flag-5'>决策</b>和端到端大<b class='flag-5'>模型</b>有何区别?

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,
    的头像 发表于 03-28 09:16 ?473次阅读

    通感一体化的测试痛点及解决方案

    通信感知一体化Integrated sensing and communication (ISAC),简称通感一体化,是第6代移动通信技术(以下简称“6G”)的研究热点之,顾名思义就
    的头像 发表于 03-27 14:03 ?2271次阅读
    通感<b class='flag-5'>一体化</b>的测试痛点及解决方案

    海康威视发布大模型一体化平台

    海康“观澜”大模型+DeepSeek“双模”协同,海康威视发布“大模型一体化平台”,围绕“汇聚、融合、开放”助力大模型能力,在千行百业快速便捷落地。
    的头像 发表于 03-20 17:34 ?995次阅读

    文看懂5G通感一体化

    ? 通感一体化:扩展通信网络业务边界,提升网络价值 通信引入感知构筑通感一体 网多能:链接物理世界和数字世界 网络通信+传统感知+泛在
    的头像 发表于 01-16 17:53 ?1808次阅读
    <b class='flag-5'>一</b>文看懂5G通感<b class='flag-5'>一体化</b>

    四维图新助力北京车路云一体化建设

    能力和优秀表现,获得了北京车网科技发展有限公司(简称:北京车网)的认可和表扬。北京车网对四维图新在车路云一体化领域的技术实力和项目经验给予了高度评价,并表示希望双方继续加强合作,共同推动北京车路云一体化建设和规模应用。
    的头像 发表于 12-09 11:10 ?799次阅读

    一体化自动气象监测系统:全天候守护,24小时不间断监测

    一体化自动气象监测系统以其全天候守护、24 小时不间断监测的特点,为我们的生产生活提供了准确、及时的气象信息,在各个领域都发挥着重要的作用。相信在未来,随着技术的不断进步,一体化自动
    的头像 发表于 11-29 09:22 ?1047次阅读
    <b class='flag-5'>一体化</b><b class='flag-5'>自动</b>气象监测系统:全天候守护,24小时不间断监测

    聊聊自动驾驶离不开的感知硬件

    自动驾驶飞速发展,绕不开感知决策和控制决策的经典框架,而感知作为自动驾驶汽车“感官”的重要组成
    的头像 发表于 08-23 10:18 ?1237次阅读

    《嵌入式机电一体化系统设计与实现》读后感

    先给大家看看封面哦 再看居然还有签名呢 还贴心的送了书签哦,爱了爱了 在阅读了曾庆祥教授所著的《嵌入式机电一体化系统设计与实现》书后,我深感收获颇丰,对嵌入式系统与机电一体化系统的设计与实现有了
    发表于 08-21 08:45