0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤绝影智能汽车事业群总裁王晓刚:通用人工智能下的智能汽车

商汤科技SenseTime ? 来源:商汤科技SenseTime ? 2023-04-04 14:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“通用人工智能将打造智能汽车的‘智慧飞轮’,让人、车和模型之间产生更多有效交互,打通三者之间的互动闭环,让AI更精准地理解人的需求,带来更好的驾乘体验。” 商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在2023中国电动汽车百人会智能汽车论坛上说。

上周,由中国电动汽车百人会主办,清华大学、中国汽车工程学会、中国汽车工业协会、中国汽车技术研究中心、中国汽车工程研究院协办的2023中国电动汽车百人会论坛在北京成功举办。 商汤科技联合创始人王晓刚教授受邀出席会议,并发表《通用人工智能下的智能汽车》主旨演讲,为人们描绘了通用人工智能(AGI)赋能人机共智的美好未来。

以下为王晓刚教授演讲内容梳理。

通用人工智能引发新一轮范式革新

新年伊始,ChatGPT 、GPT-4 掀起了通用人工智能的热潮,这是一场新的技术革命。 非常有幸与大家一起探讨通用人工智能和多模态大模型为智能汽车带来的机遇和挑战。

2022年以来,新的通用人工智能开始以更加高效的方式解决海量的开放式任务。 它更加接近人的智能,而且能够产生有智慧的内容,也带来了新的研究范式——基于一个非常强大的多模态基模型,通过强化学习和人的反馈,不断解锁模型的新能力。

那么,什么是通用人工智能? 它与现有的人工智能系统有哪些区别?

其实,现有的人工智能系统也能够接收多模态数据,但输出的任务都是事先定义好的,若为系统增加一个新任务,就要对其进行重新设计,还要采集大量样本。

而在通用人工智能时代,人们通过输入提示词和多模态内容,便可生成多模态数据。 更重要的是,它可以用自然语言方式生成任务描述,以非常灵活的方式应对大量长尾问题和开放性任务,甚至是一些主观的描述。

比如,在做一些特定场景的检索任务时,一个现有的人工智能系统可能有几十个标签。 商汤做过实验,如果用自然语言描述可能会有1万多个词,通过它们的组合去描述各种任务,实际上是非常强大且灵活的。

举个例子,给定一张自动驾驶场景中的图片,判断是否需要减速。 通过现有的 AI系统,首先要做物体检测,然后在物体框里做文字识别,最后做决策,整个过程每一个模块都是事先定义好的任务。

而在通用人工智能技术下,给定图像,人们只需用自然语言去问图像问题,比如“这个图标是什么意思? ”“接下来应该做什么?” 模型本身不会发生变化,输出端通过自然语言的方式给出一系列逻辑推理,最后得出结论。 比如,它会告诉你“限速30公里”“前面100米是学校的区域”“有小孩”“应该小心驾驶”“需将车速降到30公里以下”等操作。

可以看到,这都是一些开放式的新任务,可以对人工智能系统带来非常大的变革。

从“数据飞轮”到“智慧飞轮

通用人工智能还有非常强的一点,它能够产生内容,而且是有智慧的内容。

自动驾驶/智能汽车领域有“数据飞轮”说法,即模型能够加持终端,采取高质量的数据对模型进行更新,然后再从终端提升数据的量和质。

通用人工智能时代则会产生“智慧飞轮”,人和模型之间可以产生互动。 当人们为模型输入Align With Human Intention时,虽然模型很强大,但它并不知道人们需要什么样的能力,不过通过人的反馈,它就能更好地理解人需要它展示什么样的能力而去解锁更多的技能,同时模型为人输出有智慧的内容,从而激发人们更多的创作智慧,随后又会产生新的“智慧飞轮”。

值得一提的是,AGI对算力的需求非常大。 ChatGPT具备1750亿参数, 需要3000~5000张A100训练卡,一次训练的成本上千万美金。 直到今天,它的推理成本每天也高达几百万美金。

2021年,商汤提前布局,在上海临港建立了人工智能计算中心(AIDC)。 作为SenseCore商汤 AI大装置的算力基座,AIDC基于2.7万块GPU的并行计算系统实现了5.0 exaFLOPS的算力输出,可支持最多20个千亿参数量超大模型(以千卡并行)同时训练。

从2019年开始,商汤从10亿参数的视觉模型研发,到今天有320亿参数全球最大规模的通用视觉模型。 在NLP领域,商汤当前也有接近2000亿参数的大模型,有能力去训练1800亿参数的多模态大模型。 所以,未来通用人工智能基于多模态的基模型可以做视觉感知、语言理解、内容生成和推理决策。

通用人工智能赋能绝影驾、舱、云三位一体产品体系

商汤绝影是商汤旗下的智能汽车业务板块,坚持驾、舱、云三位一体的发展策略,希望通过驾舱融合带来更好的驾乘体验。

商汤AI云能够为自动驾驶提供数据闭环服务,能够使智能座舱成为第三生活空间。 同时,AI云也为通用人工智能赋能智能驾驶和智能座舱奠定了非常强大的基础。

在自动驾驶领域,BEV是当前主流的技术路线,未来可以朝着多模态、通用智能的方向发展。

通过AIGC可生成困难样本,在模型中输入多模态数据,同时自动驾驶多模态大模型可以做到感知和决策一体化。 在输出端,通过环境解码器可对3D环境进行重建,实现环境的可视化理解; 行为解码可生成完整的路径规划; 同时,动机解码器可以用自然语言描述推理的过程,进而使自动驾驶系统变得可以解释。

商汤基于多模态大模型,可做到数据的感知闭环和决策闭环。 从前端自动采集高质量的数据,到利用大模型进行自动化的数据标注和产品检测,能够几百倍地提升模型迭代的效率并降低成本。

在智能座舱板块,通用人工智能可以使基模型具备对空间环境理解、用户状态感知、多模态指令解析及多轮逻辑对话、内容生成等一系列能力,进而赋能包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,不断地提升座舱的个性化体验。

同时,应用场景也可以从上车、行车、停车、离车,进而拓展到娱乐、办公、购物、休息等等。

实际上,智能汽车是通用人工智能实现闭环的一个理想场景,人类已经可以做到人机共驾。 未来,车和模型之间能够产生更有效的互动,从而完成从人到车、到模型的互动闭环,通用人工智能可为人们提供更好的驾乘体验,解锁无限的想象空间。

商汤愿与客户及合作伙伴共同迈向通用人工智能时代!

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49164

    浏览量

    250736
  • 智能汽车
    +关注

    关注

    30

    文章

    3105

    浏览量

    108478
  • 商汤科技
    +关注

    关注

    8

    文章

    570

    浏览量

    36857

原文标题:商汤绝影智能汽车事业群总裁王晓刚:通用人工智能下的智能汽车

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中汽中心出席车用人工智能标准化促进中心成立会议

    近日,我国汽车领域首个以车用人工智能标准化为研究目标的技术组织——车用人工智能标准化促进中心成立会议在天津召开,中汽中心副总经理龚进峰出席会议并致辞。来自整车企业、零部件企业、高校、科研机构等70多家单位的180余位代表参会。
    的头像 发表于 07-21 16:48 ?384次阅读

    工信部辛国斌到访上海车展商汤影展台

    近日,工业和信息化部副部长辛国斌一行到访上海车展商汤影展台。商汤科技联合创始人、首席科学家、商汤
    的头像 发表于 04-30 11:51 ?363次阅读

    商汤亮相2025上海车展

    近日,第二十一届上海国际汽车工业展览会(称“2025上海车展”)隆重开幕,商汤携系列生成式AI汽车
    的头像 发表于 04-27 10:44 ?429次阅读

    商汤亮相NVIDIA GTC 2025并发表主题演讲

    商汤科技联合创始人、首席科学家、商汤CEO刚在NVIDIA GTC 2025发表演讲《激
    的头像 发表于 03-21 14:37 ?639次阅读

    智慧路灯如何应用人工智能技术

    叁仟智慧路灯通过整合人工智能(AI)技术,显著提升了城市的智能化程度,为城市管理工作带来了诸多便利。以下将详细阐述叁仟智慧路灯在应用人工智能技术方面的几个关键领域: 一、智能照明控制
    的头像 发表于 03-07 09:18 ?471次阅读
    智慧路灯如何应<b class='flag-5'>用人工智能</b>技术

    商汤首发智能座舱大模型创新产品

    近日,2024「实力AI DAY」举办。
    的头像 发表于 11-29 09:53 ?477次阅读

    嵌入式和人工智能究竟是什么关系?

    嵌入式和人工智能究竟是什么关系? 嵌入式系统是一种特殊的系统,它通常被嵌入到其他设备或机器中,以实现特定功能。嵌入式系统具有非常强的适应性和灵活性,能够根据用户需求进行定制化设计。它广泛应用于各种
    发表于 11-14 16:39

    九四智能荣耀跻身智推力2024 年度广东人工智能风云榜

    2024年10月23日至24日,由广东省人工智能产业协会主办的BAIC2024粤港澳大湾区人工智能产业大会在广州市南沙区国际金融论坛会议中心隆重举行。本次活动主题为“通用人工智能筑基 赋能千行百业
    的头像 发表于 10-24 16:16 ?696次阅读
    九四<b class='flag-5'>智能</b>荣耀跻身智推力2024 年度广东<b class='flag-5'>人工智能</b>风云榜

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    周末收到一本新书,非常高兴,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 《AI for Science:人工智能驱动科学创新》这本书的第一章,作为整个著作的开篇
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    人工智能推荐系统中强大的图形处理器(GPU)一争高下。其独特的设计使得该处理器在功耗受限的条件仍能实现高性能的图像处理任务。 Ceremorphic公司 :该公司开发的分层学习处理器结合了
    发表于 09-28 11:00

    镭神智能创始人胡小波荣获全国首批首席人工智能官(CAIO)称号

    2024年8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会在深圳国际会展中心(宝安)举办。会上,深圳市人工智能产业协会公布了全国首批首席人工智能
    的头像 发表于 09-27 08:08 ?948次阅读
    镭神<b class='flag-5'>智能</b>创始人胡小波荣获全国首批首席<b class='flag-5'>人工智能</b>官(CAIO)称号

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    材料基因组工程的推动人工智能如何与材料科学结合,加快传统材料和新型材料的开发过程。 第4章介绍了人工智能在加快药物研发、辅助基因研究方面及在合成生物学中的普遍应用。 第5章介绍了人工智能
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会将在深圳国际会展中心(宝安)举办。大会以“魅力AI·无限未来”为主题,致力于打造全球通用人工智能领域集产品
    发表于 08-22 15:00

    AMD 与中科创达达成战略合作,共同打造汽车智能座舱

    。AMD?全球副总裁蕾、AMD?大中华区汽车市场销售总监张宁、AMD汽车市场业务拓展总监张磊、中科创达执行总裁
    的头像 发表于 08-07 10:03 ?704次阅读
    AMD 与中科创达达成战略合作,共同打造<b class='flag-5'>汽车</b><b class='flag-5'>智能</b>座舱