0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

魔视智能MOTOVIS ? 来源:魔视智能MOTOVIS ? 2023-07-13 15:41 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年7月8日,自动驾驶新势力Tier 1 魔视智能MOTOVIS创始人&CEO虞正华博士受邀参加「2023 WAIC大模型与智能驾驶创新高端闭门会」,与参会人员深度探讨AI大模型在智能驾驶领域的关键应用、技术挑战、协同创新等时下热点。

本场闭门会以“智能驾驶新征程——大模型赋能下的商业化机遇与挑战”为题,由世界人工智能大会组委会办公室、上海市张江科学城建设管理办公室指导,上海张江(集团)有限公司、机器之心联合主办,旨在助力产业链企业更好地把握大模型发展趋势,推动企业间的业务合作与交流,加速智能驾驶商业化进程,为张江的「未来车生态」注入新的活力。

大模型在许多领域展示出了巨大的应用潜力,但在智能驾驶领域至今还未展现出一个非常成功的智能驾驶大模型。智能驾驶作为一个充满挑战和机遇的领域,与大模型的结合将碰撞出怎样的火花?

虞正华博士指出,目前确实有很多视觉大模型的尝试,包括在图像识别、实时目标检测和跟踪方面以及图像合成、图像修复、图像增强等应用的进展,但未来自动驾驶的大模型一定不是纯视觉的大模型,还需要综合视觉、语言等多模态技术。

未来的端到端的自动驾驶大模型,是否能将规划闭环在内还不确定,但是至少可以考虑将感知和预测放在一个端到端的模型中,将这个问题定义为一个泛感知问题,而这个模型的目标就是感知外部的世界,包括现在的和未来的(预测的)目标,为规划提供基础信息。

将语言大模型的“推理”能力跟视觉大模型的“感知”能力去结合,并进一步演变下去,发展成为真正的智能驾驶大模型。这种结合大模型推理能力和环境感知能力的智能驾驶系统,能够在实时感知、决策制定和控制执行方面发挥重要作用。然而,实现自动驾驶仍需综合考虑多个因素,如硬件平台、安全性、法律法规等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能驾驶
    +关注

    关注

    4

    文章

    2841

    浏览量

    50186
  • 自动驾驶
    +关注

    关注

    790

    文章

    14416

    浏览量

    171623
  • 大模型
    +关注

    关注

    2

    文章

    3250

    浏览量

    4245

原文标题:2023 WAIC | 魔视智能虞正华:未来自动驾驶的大模型一定不是纯视觉的大模型

文章出处:【微信号:motovis,微信公众号:魔视智能MOTOVIS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智能华荣获2024年度汽车电子科学技术奖创新人物奖

    近日,在IAEIS 2025第十四届国际汽车电子产业峰会上,智能CEO博士荣膺2024
    的头像 发表于 07-05 11:19 ?622次阅读

    为什么自动驾驶端到端大模型有黑盒特性?

    、激光雷达数据)映射到控制输出(如方向盘转角、加速度、制动等),以深度神经网络为核心,打通了从视觉驾驶行为的完整链条。它也代表了自动驾驶从“规则驱动”向“数据驱动”的跃迁,展现了极高的潜力。当然这种结构也天然地带来了
    的头像 发表于 07-04 16:50 ?318次阅读
    为什么<b class='flag-5'>自动驾驶</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作
    的头像 发表于 06-24 08:53 ?245次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    视觉自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这
    的头像 发表于 06-16 09:56 ?337次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的<b class='flag-5'>自动驾驶</b>会有哪些安全问题?

    视觉自动驾驶如何理解路边画报上的人?

    行业来说,其实是个值得深思的问题。随着自动驾驶技术下沉到消费市场,基于视觉自动驾驶系统就是依托于车载摄像头来识别路况,如果遇到了类似海
    的头像 发表于 05-19 09:16 ?285次阅读

    模型如何推动自动驾驶技术革新?

    [首发于智驾最前沿微信公众号]近年来,人工智能技术以前所未有的速度在各个领域渗透与应用,而大模型(大语言模型和多模态大模型)的迅猛发展为
    的头像 发表于 04-20 13:16 ?363次阅读
    大<b class='flag-5'>模型</b>如何推动<b class='flag-5'>自动驾驶</b>技术革新?

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    近年来,人工智能技术迅速发展,大规模深度学习模型(即大模型)在自然语言处理、计算机视觉、语音识别以及自动驾驶等多个领域取得了突破性进展。
    的头像 发表于 03-28 09:16 ?500次阅读

    海康威推出视觉模型系列摄像机

    依托海康观澜大模型技术体系,海康威将大模型能力直接部署至端侧,推出系列视觉模型摄像机。
    的头像 发表于 03-05 14:06 ?901次阅读

    智能MOTOVIS获「2024年度SASD中欧智能汽车科技创新奖」

    12月3日至4日,以“AI大模型赋能:智能汽车创新与高质量发展”为主题的第五届智能网联汽车与自动驾驶创新国际大会在安徽芜湖隆重召开。
    的头像 发表于 12-05 09:06 ?1188次阅读
    <b class='flag-5'>魔</b><b class='flag-5'>视</b><b class='flag-5'>智能</b>MOTOVIS获「2024年度SASD中欧<b class='flag-5'>智能</b>汽车科技创新奖」

    马斯克重申:视觉自动驾驶未来

    近日,特斯拉始终坚持其独特的视觉感知系统。这系统摒弃了传统的毫米波雷达,完全依赖于摄像头与先进的人工神经网络,以实现自动驾驶的功能。 特斯拉CEO埃隆·马斯克近期再次就
    的头像 发表于 12-04 14:09 ?900次阅读

    连接视觉语言大模型与端到端自动驾驶

    端到端自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然存在局限性,这是因为端到端模型缺乏常识知识和逻辑思维。
    的头像 发表于 11-07 15:15 ?801次阅读
    连接<b class='flag-5'>视觉</b>语言大<b class='flag-5'>模型</b>与端到端<b class='flag-5'>自动驾驶</b>

    Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

    迈新步,为其机器人出租车业务引入了种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”(E
    的头像 发表于 10-31 16:55 ?1927次阅读

    智能驾驶自动驾驶的关系

    智能驾驶自动驾驶在概念上存在一定的联系和区别,以下是对两者关系的介绍: 、概念定义 智能
    的头像 发表于 10-23 16:02 ?1698次阅读

    激光雷达与视觉方案,哪个才是自动驾驶最优选?

    主要分为两大类:激光雷达与视觉感知。激光雷达因其能够提供精确的距离和形状信息,在自动驾驶技术早期的开发中被广泛应用。然而,随着计算机视觉技术的飞速进步,基于摄像头的
    的头像 发表于 09-29 10:47 ?1315次阅读

    特斯拉智能驾驶|从视觉优先的技术路径到未来的挑战?

    特斯拉作为全球智能驾驶领域的技术先锋,其FSD(Full Self-Driving)方案选择了独特的视觉自动驾驶路线,摒弃了激光雷达和高精
    的头像 发表于 09-12 08:57 ?4894次阅读
    特斯拉<b class='flag-5'>智能</b><b class='flag-5'>驾驶</b>|从<b class='flag-5'>视觉</b>优先的技术路径到<b class='flag-5'>未来</b>的挑战?