0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

商汤科技SenseTime ? 来源:未知 ? 2023-10-04 18:50 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月2日至6日,全球AI顶级国际会议ICCV(International Conference on Computer Vision)在法国巴黎举行。本届ICCV投稿总数达8068篇,其中2160篇被接收,录用率为26.8%,略高于上届ICCV 2021录用率25.9%。


商汤科技及联合实验室共49篇论文入选,涵盖文生图、3D数字人、自动驾驶、目标检测、视频分割等多个与大模型和生成式AI相关的热点方向。

基于商汤AI大装置SenseCore和“日日新SenseNova”大模型体系。在生成式AI和视觉大模型等领域,商汤提出多项极具价值的技术突破和研究范式创新

商汤科技联合创始人、首席科学家王晓刚表示持续深耕AI基础设施建设、坚持做注重产业实践的学术研究、深耕人才阶梯式培养,是商汤多年来在全球学术舞台上不断产出创新成果的基石。商汤将积极拥抱大模型带来的全新研究范式,不断提升研发体系,坚持将基础研究与业务发展紧密融合,为行业贡献更具价值的技术成果。

多项技术突破和范式创新

大模型及生成式AI成焦点

大模型和生成式AI在全球范围内备受瞩目,也为学术研究提出了诸多具有挑战性的全新课题。

生成式AI方向的文生图领域,如何让模型更容易生成与人类偏好相符的图像?在论文《Human Preference Score: Better Aligning Text-to-Image Models with Human Preference》中,商汤研究团队将人类偏好引入Stable Diffusion的模型训练中,证明了人类偏好信息可以提升Stable Diffusion生成的图像质量,尤其在人体、四肢等经典的failure case中更是展示了优异的效果。

wKgaomUtDvCAEpKfAAC5LWRQ3q4619.jpg将人类偏好引入StableDiffusion的模型训练过程

数字人是生成式AI的重要领域,但其制作依然需要一定门槛。商汤研究团队在论文《SHERF: Generalizable Human NeRF from a Single Image》中提出一种基于单张图片的可泛化、可驱动人体神经辐射场方法,仅需一张任意角度的3D人体图片,结合必要的参数,就能实现3D数字人重建和驱动,有望简化3D数字人的创作流程。

wKgaomUtDvCANNRvAAMkogQRJNI501.png

基于单张图片的人体神经辐射场重建和驱动

高质量的3D人体数据集是研究众多人体相关的感知模型、重建模型和生成式AI的基础。商汤研究团队在论文《SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling》中提出一个合成数据集SynBody,其构建了穿着衣物的参数化人体模型,并生成了海量的人体虚拟数据,有助于3D人体感知和重建的模型训练。此外,团队公布了开源代码库XRFeitoria,一个合成数据渲染工具箱,通过提供方便的Python API与CLI工具,极大简化了制作虚拟数据集的流程。

wKgaomUtDvGACiGhAA2ggPrgJBQ040.pngSynBody是基于分层人体模型的大规模合成

数据集,可用于人体感知与建模等任务

在自动驾驶场景的3D目标检测领域,商汤团队还在论文《Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction》中提出一种新的用于多视角3D检测的时序增强训练方式——历史帧物体预测(HoP),不仅在nuScenes测试集上使用ViT-L得到了68.5%NDS和62.4%mAP,超过了排行榜上所有3D物体检测器,还可以即插即用,无缝集成到最先进的 BEV 检测框架中,重塑3D检测时序利用的新范式。

wKgaomUtDvGAYHl5AADe94DmIrg067.jpgHoP算法框架图

此外,本届ICCV,商汤科技还在目标检测、视频分割、3D感知与重建、半监督学习、NeRF等领域取得诸多技术创新突破。

开源开放

构建大模型时代

产学研协同新生态

产学研协同是实现学术研究成果到行业应用转化的高效路径。

商汤不断夯实技术研究的同时,也积极参与和举办各类学术交流和竞赛活动,促进创新成果产出,探索大模型时代产学研协作模式的构建。

同时,商汤长期致力于推动AI基础设施和开源生态的建设,与开发者共创共建,共同推动AI社区的繁荣发展。

商汤早在2018年开源的计算机视觉框架OpenMMLab已在GitHub上收获超过8.7万个星标

今天,商汤的开源项目已拓展到决策智能、大语言模型、拓展现实、数据平台、高性能训练和推理框架、AI智能体框架等领域,为学术界的科研突破和工业界的产业落地提供全方位的算法与平台支撑。

其中,在大语言模型领域,商汤与上海AI实验室等联合推出的书生·浦语大模型(InternLM)在开源社区和产业界产生广泛影响。

最新的InternLM-20B模型性能先进且应用便捷,以不足三分之一的参数量,达到当前被视为开源模型标杆的Llama2-70B的能力水平。

秉承开源、开放的发展理念,商汤愿与行业伙伴共同迎接大模型的新一轮科技革命,让AI技术释放更广泛的产业价值。

wKgaomUtDvGARGkGAAATzh3tzFA448.gif

相关阅读,戳这里

《商汤联合团队斩获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型》

wKgaomUtDvGAN7iPAAC4LKEIjVg894.jpg


原文标题:ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    575

    浏览量

    36908

原文标题:ICCV 2023生成式AI引人瞩目,商汤多项技术突破展现中国“创新力”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成 AI 重塑自动驾驶仿真:4D 场景生成技术突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效
    的头像 发表于 08-06 11:20 ?3289次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4D 场景<b class='flag-5'>生成</b><b class='flag-5'>技术</b>的<b class='flag-5'>突破</b>与实践

    使用NVIDIA Earth-2生成AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)为这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成 AI 基础模型
    的头像 发表于 06-12 15:54 ?595次阅读

    从Gartner报告看Atlassian在生成AI领域的创新路径与实践价值

    Atlassian入选Gartner 2025生成AI技术"新兴领导者"!其核心AI产品Rovo依托Teamwork Graph,支持从团
    的头像 发表于 06-05 15:59 ?628次阅读
    从Gartner报告看Atlassian在<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>领域的<b class='flag-5'>创新</b>路径与实践价值

    2025设备管理新范式:生成AI在故障知识库中的创新应用

    生成 AI 提供了全新的解决方案,引领设备管理进入“健康治理”新纪元。传统设备管理深陷知识困局,知识沉淀遭遇“三重断点”,而生成
    的头像 发表于 03-31 10:44 ?525次阅读
    2025设备管理新范式:<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>在故障知识库中的<b class='flag-5'>创新</b>应用

    聚云科技获亚马逊云科技生成AI能力认证

    的应用上展现出了卓越的能力。 聚云科技通过整合亚马逊云科技的先进技术,从应用范围确定、模型选择、数据处理、模型调优到应用集成与部署,为企业提供全方位的生成
    的头像 发表于 02-19 10:33 ?569次阅读

    生成AI工具好用吗

    当下,生成AI工具正以其强大的内容生成能力,为用户带来了前所未有的便捷与创新。那么,生成
    的头像 发表于 01-17 09:54 ?530次阅读

    国内生成AI备案数量突破300款

    服务数量高达238款,占据了总备案数量的绝大部分,充分展示了该领域技术创新和市场需求的强劲动力。这一快速增长不仅反映了国内企业在生成AI技术
    的头像 发表于 01-09 11:14 ?956次阅读

    美洽荣登2024中国生成AI 创新企业系列榜单-智能客服创新企业榜

    近日,由第一新声联合天眼查发起的“2024中国生成AI创新企业系列榜单”正式发布,美洽凭借在智能客服领域
    的头像 发表于 12-31 15:12 ?653次阅读
    美洽荣登2024<b class='flag-5'>中国</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b> <b class='flag-5'>创新</b>企业系列榜单-智能客服<b class='flag-5'>创新</b>企业榜

    商汤科技领跑2024年中国GenAI技术栈市场

    创新实力强、应用落地广,GenAI(生成AI技术栈领域,商汤科技位居国内榜首!
    的头像 发表于 12-27 16:07 ?800次阅读

    Imagination 系列研讨会 |中国生成 AI 的发展

    近期,Imagination将陆续推出全新系列研讨会,涵盖边缘AI如何推动工业物联网的发展,生成AI,智能汽车未来发展趋势等等多个热门话题。本期研讨会中,Imagination
    的头像 发表于 12-09 16:57 ?761次阅读
    Imagination 系列研讨会 |<b class='flag-5'>中国</b><b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 的发展

    中国生成AI用户突破2.3亿

    数字占据了全国总人口比例的16.4%,显示出我国民众对于生成人工智能技术的浓厚兴趣与广泛应用。 报告还着重强调了政府在推动人工智能技术发展方面所做出的努力。在过去的一年里,政府高度重
    的头像 发表于 12-02 10:05 ?731次阅读

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.
    的头像 发表于 10-28 11:19 ?830次阅读

    天玑9400生成AI技术太牛了!打造最强AI体验

    联发科技再度突破技术前沿,推出全新天玑9400旗舰芯片,这是业界首款集成智能体AI的5G SoC。继天玑9300首次将生成
    的头像 发表于 10-14 14:06 ?731次阅读
    天玑9400<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>技术</b>太牛了!打造最强<b class='flag-5'>AI</b>体验

    谷歌Vertex AI助力企业生成AI应用

    DeepMind 在模型技术方面积极探索创新,尤其着力于 Gemini 和 Imagen 的改进。我们的企业 AI 平台 Vertex AI 也推出了数十项
    的头像 发表于 09-09 15:59 ?1015次阅读

    技术突破】MT6701磁编码IC车机ECU自动化测试生产线

    在当今汽车工业的快速发展中,技术创新与进步成为了推动行业前进的关键力量。MT6701 磁编码 IC 车机 ECU 的自动化装配测试生产线就是其中一项引人瞩目技术
    的头像 发表于 08-20 17:44 ?1402次阅读