0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

佐思汽研发布《2023-2024年汽车AI大模型技术和应用趋势报告》

佐思汽车研究 ? 来源:佐思汽车研究 ? 2024-02-28 14:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年以来,越来越多车型开始接入大模型,越来越多Tier1推出汽车大模型解决方案。特斯拉FSD V12的出色进展和SORA的推出,更加速了AI大模型在座舱和智驾领域的落地。

端到端自动驾驶大模型的发展突飞猛进

2023年2月,采用端到端自动驾驶模型的特斯拉FSD v12.2.1已经开始陆续在美开启推送,不仅仅是员工和测试人员。根据首批客户的反馈,FSD V12 相当强大,让以前不相信不敢用自动驾驶的普通人也敢于使用FSD了。譬如,特斯拉 FSD V12 可绕行路边积水,一位特斯拉的工程师评论说:这种开法很难用明确的代码来实现,但特斯拉的端到端方案几乎毫不费力地实现了。

自动驾驶AI大模型的发展可以分为四个阶段:

1.0时代就是在感知层面使用大模型(Transformer);

2.0时代就是模块化,感知规控决策都用大模型;

3.0时代就是端到端大模型(一“端”是传感器的原始数据,另一“端”直接输出驾驶动作);

4.0时代就是从垂直领域的人工智能走向通用领域的人工智能(AGI的世界模型)。

现在多数公司处于2.0时代。特斯拉FSD V12已处于3.0时代。其他主机厂和Tier1纷纷跟进FSD V12的端到端大模型。2024年1 月 30 日,小鹏汽车宣布,小鹏的端到端模型下一步将会全面上车。据悉,蔚来和理想的“基于端到端”自动驾驶模型也将在2024年上线。

FSD V12驾驶决策交由AI算法生成,用海量视频数据训练出的端到端神经网络,替换掉了超过30万行C++代码。FSD V12提供了一条有待验证的全新路径,若得以走通,将对行业产生颠覆性影响。

2月16日,OpenAI发布文本生成视频模型SORA,标志着AI视频应用即将大规模应用的前夜。SORA不仅支持通过文本或图像生成长达60秒的视频,其视频生成能力、复杂场景和角色生成能力、以及对物理世界模拟的能力,都显著超越了之前的技术。

SORA和FSD V12都是通过视觉让AI能够理解甚至模拟真实的物理世界。Elon Mask认为,“FSD 12和Sora不过是AI通过视觉认知世界、理解世界上的两个开花结果,FSD最终用于驾驶行为,Sora则是用来生成视频。”

SORA的爆火,进一步证明了FSD V12的合理性。马斯克称「特斯拉已经能够制作真实世界视频大约一年了」。

d760aeb0-d5f2-11ee-a297-92fbcf53809c.jpg

来源:Twitter

AI大模型快速演化,带来全新机会

最近三年,自动驾驶大模型经历了若干次的演化,领先车企的自动驾驶系统几乎每年要重写一次。这也给后来者提供了切入机会。

CVPR2023上,商汤、OpenDriveLab、地平线等联合发布的端到端的自动驾驶算法UniAD,获得了2023年的最佳论文。

2024年初,中科慧拓技术团队和中科院自动化所共同提出的生成式端到端自动驾驶模型GenAD,将生成式人工智能(Generative AI)和端到端自动驾驶技术结合,是业界首个生成式端到端自动驾驶模型。该技术颠覆了UniAD的渐进式流程端到端方案,探讨了一种新的端到端自动驾驶范式,关键在于采用生成式人工智能的方式预测自车和周围环境在过去场景中的时序演变方式。

d76f1e64-d5f2-11ee-a297-92fbcf53809c.png

来源:中科慧拓

2024年2月,地平线和华中科技大学提出了VADv2,一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列,将传感器数据转换为环境标记嵌入,输出动作的概率分布,并从中采样一个动作来控制车辆。仅使用摄像头传感器,VADv2在CARLA Town05基准测试中实现了最先进的闭环性能,显著优于所有现有方法。它能够在完全端到端的方式下稳定运行,甚至不需要基于规则的封装。

d77c9026-d5f2-11ee-a297-92fbcf53809c.png

来源:地平线

在Town05长距离基准测试中,VADv2取得了85.1的驾驶分数,98.4的路程完成度,以及0.87的违规分数,如表1所示。与之前的最先进方法相比,VADv2在路程完成度更高的同时,显著提高了驾驶分数,增加了9.0。值得注意的是,VADv2仅使用摄像头作为感知输入,而DriveMLM同时使用了摄像头和激光雷达。此外,与之前仅依赖摄像头最佳方法相比,VADv2显示出更大的优势,驾驶分数的显著提高达到了16.8。

d78cb58c-d5f2-11ee-a297-92fbcf53809c.png

来源:地平线

也是在2024年2月,清华大学交叉信息研究院和理想汽车提出了 DriveVLM。DriveVLM的整体流程如下图所示。一系列图像被大型视觉语言模型(VLM)处理,以执行特定的链式思维(CoT)推理,得出驾驶规划结果。这个大型VLM包括一个视觉编码器和一个大型语言模型(LLM)。

d79dd2ae-d5f2-11ee-a297-92fbcf53809c.png

来源:清华大学交叉信息研究院

由于VLMs在空间推理和高计算需求方面的局限性,DriveVLM团队又提出了DriveVLM-Dual,一个结合了DriveVLM与传统自主驾驶流水线优势的混合系统。DriveVLM-Dual可选择性地将DriveVLM与传统的3D感知和规划模块相结合,例如3D目标检测器、占用网络和运动规划器,使系统能够实现3D定位和高频规划能力。这种双重系统设计,类似于人脑的慢速和快速思考过程,能够有效适应驾驶场景中不断变化的复杂性。

大模型兴起,AI和云计算公司受关注

AI大模型兴起,算力、算法和数据三者缺一不可。擅长算法,储备了大量算力的AI公司(如科大讯飞、商汤科技、旷视科技等),以及具备强大智算中心的云计算公司(如浪潮、火山引擎、腾讯云等)受到主机厂关注。

商汤在AI大模型领域布局了座舱多模态大模型SenseChat-Vision、AIDC智算中心(6000P算力)、自动驾驶大模型DriveMLM。2024年初,商汤推出DriveMLM,在闭环测试最权威榜单CARLA上取得很好的成绩。DriveMLM是介于模块化和端到端方案之间的中间方案,具备可解释性。

d7add4ec-d5f2-11ee-a297-92fbcf53809c.jpg

来源:商汤科技

在自动驾驶的Corner Case采集上,火山引擎和毫末智行一起将大模型应用在场景生成和标注提效上。在火山引擎提供的云服务能力支持下,毫末DriveGPT大模型的预标注,整体效率提升了10倍。

2023年,腾讯发布了在智能汽车云、智驾云图、智能座舱等领域的升级产品和方案。算力方面,腾讯智能汽车云带来3.2Tbps带宽,算力性能提升3倍,通信性能提升10倍,计算集群GPU利用率提升60%以上,为智能驾驶大模型训练提供高带宽、低延迟的智算能力支撑。

在训练加速方面,腾讯智能汽车云结合太极Angel训练加速框架,训练速度相比业界主流框架提高1倍,推理速度相比业界主流框架提升1.3倍。博世、蔚来汽车、英伟达、奔驰、文远知行等企业目前都是腾讯智能汽车云的用户。2024年,腾讯将进一步加强AI大模型的建设。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 特斯拉
    +关注

    关注

    66

    文章

    6385

    浏览量

    129520
  • 自动驾驶
    +关注

    关注

    790

    文章

    14394

    浏览量

    171441
  • FSD
    FSD
    +关注

    关注

    0

    文章

    105

    浏览量

    6812
  • OpenAI
    +关注

    关注

    9

    文章

    1220

    浏览量

    9083
  • 大模型
    +关注

    关注

    2

    文章

    3230

    浏览量

    4223

原文标题:汽车AI大模型研究:端到端突飞猛进,大模型演化带来全新机会

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025汽车微电机及运动机构行业研究报告

    研发布了《2025汽车微电机及运动机构行业研究报告
    的头像 发表于 02-20 14:14 ?1255次阅读
    2025<b class='flag-5'>年</b><b class='flag-5'>汽车</b>微电机及运动机构行业研究<b class='flag-5'>报告</b>

    AI模型汽车应用中的推理、降本与可解释性研究

    研发布2024-2025AI
    的头像 发表于 02-18 15:02 ?1402次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在<b class='flag-5'>汽车</b>应用中的推理、降本与可解释性研究

    2024-2025新车及供应商发展趋势分析

    研发布2024-2025中国乘用车新车及供应商特点
    的头像 发表于 02-17 15:20 ?1132次阅读

    2024AI编程技术与工具发展总结

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI? 联合发布了《2024 中国开源开发者报告》 。 报告聚焦
    的头像 发表于 02-13 09:11 ?805次阅读
    <b class='flag-5'>2024</b><b class='flag-5'>年</b><b class='flag-5'>AI</b>编程<b class='flag-5'>技术</b>与工具发展总结

    车载语音高阶功能装配率飙升,趋向认知交互发展

    研发布《2025车载语音行业研究报告》。 01 车载语音装配率突破83%,高阶语音功能装
    的头像 发表于 02-10 13:43 ?1418次阅读
    车载语音高阶功能装配率飙升,趋向认知交互发展

    盘点2024-2025汽车技术应用趋势

    研发布2024-2025智能汽车
    的头像 发表于 02-09 09:08 ?2582次阅读
    盘点<b class='flag-5'>2024</b>-2025<b class='flag-5'>年</b><b class='flag-5'>汽车</b>新<b class='flag-5'>技术</b>应用<b class='flag-5'>趋势</b>

    2024智驾OTA总结:8家主机厂新增代客泊车功能

    研发布《 中国汽车智驾技术与数据趋势月度监测
    的头像 发表于 01-22 10:19 ?1380次阅读
    <b class='flag-5'>2024</b>智驾OTA总结:8家主机厂新增代客泊车功能

    2024乘用车车机系统三大OTA亮点功能盘点

    研发布《 中国汽车车联网技术与数据趋势月度监测
    的头像 发表于 01-20 10:56 ?2030次阅读
    <b class='flag-5'>2024</b><b class='flag-5'>年</b>乘用车车机系统三大OTA亮点功能盘点

    自动驾驶域控研究:One board/One Chip方案将对汽车供应链产生深远影响

    研发布了《2024-2025自动驾驶域控制器和中央计算机(CCU)行业研究
    的头像 发表于 12-30 11:38 ?2282次阅读
    自动驾驶域控研究:One board/One Chip方案将对<b class='flag-5'>汽车</b>供应链产生深远影响

    数据:2023-20241-10月中国乘用车新车毫米波雷达安装量情况

    来源:新四化数据库 来源:新四化数据库 ?
    的头像 发表于 12-18 11:37 ?1114次阅读
    <b class='flag-5'>佐</b><b class='flag-5'>思</b>数据:<b class='flag-5'>2023-2024</b><b class='flag-5'>年</b>1-10月中国乘用车新车毫米波雷达安装量情况

    英特尔发布2023-2024企业社会责任报告

    近日,英特尔发布2023-2024英特尔中国企业社会责任报告》,展示其在履责、包容、可持续、赋能的“RISE”战略和2030目标指引下,在中国积极履行企业社会责任所取得的丰硕成果。英特尔已连续18
    的头像 发表于 11-25 17:07 ?926次阅读

    中科创达入选车载操作系统TOP10企业

    日前,由上海临港新片区管委会主办,上海临港新片区投资控股集团和信息咨询公司承办的2024汽车操作系统与AI
    的头像 发表于 11-14 11:47 ?1179次阅读

    汇川技术2023-2024度信息披露评价荣获A级

    近期,深圳证券交易所正式公布了深市上市公司2023-2024度信息披露评价结果。汇川技术(300124.SZ)依托卓越的信息披露质量、规范的公司治理体系、全面的投资者沟通交流以及丰厚的股东回报
    的头像 发表于 10-14 09:01 ?1373次阅读

    2024汽车操作系统趋势及TOP10分析报告

    2024汽车操作系统趋势及TOP10分析报告
    的头像 发表于 09-30 08:07 ?756次阅读
    <b class='flag-5'>2024</b><b class='flag-5'>年</b><b class='flag-5'>汽车</b>操作系统<b class='flag-5'>趋势</b>及TOP10分析<b class='flag-5'>报告</b>

    智现未来荣获甲子光年“2023-2024度科技产业最具投资价值企业”

    8月28日,甲子光年「举棋恰少年·2024甲子引力X科技产业投资大会」在北京成功举办,大会吸引了国内数百家创投机构及科技企业热情参与。大会现场发布了【2023-2024度中国科技产业
    的头像 发表于 08-29 16:26 ?886次阅读
    智现未来荣获甲子光年“<b class='flag-5'>2023-2024</b><b class='flag-5'>年</b>度科技产业最具投资价值企业”