鹭岛论坛
数据智能系列讲座第7期
「面向高泛化能力的
视觉感知系统空间建模与微调学习」
6月25日(周三) 20:00
精彩开播
期待与您云相聚,共襄学术盛宴!
| 直播信息
报告题目
面向高泛化能力的视觉感知系统空间建模与微调学习
报告简介
构建高效、物理一致且具备良好泛化能力的视觉感知系统,是视觉智能、边缘计算与具身机器人中的关键挑战。为提升系统的泛化与适应能力,一类方法致力于构建物理一致的世界模型,增强空间建模能力;另一类则关注参数高效的迁移学习,提升任务适配效率。然而,传统方法多依赖隐式生成模型或全参数微调,存在三维一致性差、训练不稳定、部署开销大等问题。
本报告介绍两个最新进展:DSG-World 提出基于双状态观测的三维高斯建模方法,通过双视角感知与一致性约束,实现对遮挡物体的精确建模,提升三维重建与仿真的泛化性能;Swin-BAPAT 框架基于 Swin Transformer,引入高效并行适配机制,仅微调少量参数即可实现对行为识别任务的精确适配,兼顾精度与部署效率。
报告嘉宾
李 玺
IAPR/IET/AAIA Fellow
浙江大学求是特聘教授
王高昂
浙江大学国际联合学院研究员
博士生导师
俞鑫波
浙江大学国际联合学院研究员
博士生导师
特邀主持
黄礼泊
中国科学院计算技术研究所
特别研究助理
讲座时间
2025年6月25日(周三)2015
讲座环节及流程
?讲座环节:
① 5 分钟主持人进行主题与嘉宾介绍
② 55分钟报告嘉宾讲座环节
③ 15分钟互动问答环节
?讲座流程:
① 19:45 开芯会视频号上线,欢迎观众朋友提前进入直播间候场
② 20:00 主持人开场
③ 20:05 主讲嘉宾依次开始讲座,持续55min
注:【在讲座过程中欢迎观众朋友通过各直播平台进行提问 工作人员将收集和整理问题】
③ 21:00 主持人根据工作团队整理的问题与嘉宾进行问答互动,持续15min
讲座形式
视频号、B站、电子发烧友、蔻享学术等多平台同步直播
点击预约精彩不容错过!
诚邀各界嘉宾
线上参会、扫码关注
报告嘉宾
李 玺
IAPR/IET/AAIA Fellow,IEEE Senior Member,CCF杰出会员,浙江大学求是特聘教授,国家杰出青年科学基金获得者,国家青年特聘专家,入选全球前2%顶尖科学家榜单(包括终身科学影响力排行榜和年度科学影响力排行榜),Elsevier 2023“中国高被引学者”,科技部科技创新2030新一代人工智能重大项目首席科学家,国家自然科学基金重点项目负责人,教育部重点规划研究项目负责人,第七届中国图象图形学会理事,浙江省自然科学基金重大项目负责人,浙江省杰出青年科学基金获得者,浙江省特聘专家,杭州市钱江特聘专家,浙江省151人才培养工程第二层次, 中国信息与电子科技发展战略研究中心专家委员会特聘专家。主要从事计算机视觉、模式识别和机器学习等领域的研究和开发。 在国际权威期刊和国际顶级学术会议发表或录用文章200余篇。荣获2021年世界人工智能大会最高奖“卓越人工智能引领者(SAIL奖)”,并获得多项国内外学术与技术奖项,包括ACCV 2010与DICTA 2012最佳论文奖、ACML 2017最佳学生论文奖、ICIP 2015 Top 10%论文奖,以及多篇期刊优秀论文(《中国图象图形学报》2019封面文章、2020年度优秀论文)。在产学研合作方面,获得2024年与2022年华为“难题揭榜”火花价值奖、2021年度优秀技术合作成果奖。其他重要奖项还包括:中国图象图形学会自然科学奖二等奖、中国电子学会科技进步一等奖、中国产学研合作促进奖、陆增镛CAD&CG高科技奖一等奖、教育部科技进步一等奖、两项北京市自然科学奖(一、二等奖)、中国专利优秀奖及2023年腾讯鹅厂好专利奖。
王高昂
浙江大学国际联合学院研究员、博士生导师,分别于复旦大学、威斯康星大学麦迪逊分校、华盛顿大学获得本科、硕士和博士学位。曾担任旷视科技北美研究院研究员、Wyze Labs 研究员。研究方向包括视觉感知、空间智能、具身智能等,在高质量国际期刊及国际会议上发表论文80余篇,谷歌学术引用2900 余次,H-index 30。在英伟达智慧城市挑战赛等国际学术竞赛中荣获4项冠军名次。担任视觉与学习青年学者研讨会(VALSE)第八届执行领域主席委员会委员、PRCV会议领域主席、CVPR长视频理解研讨会主办成员、ICMR雷达目标检测挑战赛主办成员。主持和参与多项国家自然科学基金项目、浙江省重大及重点项目、浙江省线下一流本科国际化课程建设项目、浙江大学教改项目,担任科技部重点研发项目课题负责人、科技创新2030-“新一代人工智能”青年科学家项目子课题负责人。
俞鑫波
浙江大学国际联合学院研究员、博士生导师,于香港理工大学计算机系取得硕士和博士学位。曾在美国伊利诺伊大学厄巴纳香槟校区访学。研究方向包括多模态融合、知识迁移、人体行为感知等,在国内外权威期刊会议上共发表学术论文20余篇,其中近5年以第一作者发表论文11篇,包括:IEEE TPAMI,ICCV,AAAI,IJCAI和ACM CSUR等;开源算法5个;研究成果在ResearchGate上成为自2020年首次发表起Research Interest Score全球前2%研究者;担任IJCAI 2022 Machine Learning for Vision分会场主席。担任浙江省自然科学基金青年项目负责人,获得浙江省级人才项目。
主持嘉宾
黄礼泊
博士,中国科学院计算技术研究所特别研究助理。主要研究领域为机器学习理论和深度学习应用,尤其是无监督学习、持续学习、最优化理论等方面的研究。在包括IEEE Transactions系列、AAAI、ICLR、CVPR、NeurIPS等国内外期刊和会议上发表论文20余篇。作为负责人承担国家领域预研课题、国家公派留学基金、北京市自然科学基金青年基金等多个项目。
-
感知系统
+关注
关注
1文章
80浏览量
16235 -
视觉感知
+关注
关注
0文章
48浏览量
3446
发布评论请先 登录
直播预约 |开源芯片系列讲座第28期:高性能RISC-V微处理器芯片

明晚开播 | 数据智能系列讲座第6期:大模型革命背后的算力架构创新

直播预约 | 数据智能系列讲座第6期:大模型革命背后的算力架构创新

明晚开播 | 开源芯片系列讲座第27期:RISC-V AI指令集的标准化与开源实现

直播预约 | 开源芯片系列讲座第27期:RISC-V AI指令集的标准化与开源实现

直播预约 |开源芯片系列讲座第26期:奕斯伟RISC-V GCC工具链实践分享

《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型
直播预约 |开源芯片系列讲座第25期:RISC-V架构在高性能领域的进展与挑战

开源芯片系列讲座第24期:基于SRAM存算的高效计算架构

直播预约 |开源芯片系列讲座第24期:SRAM存算一体:赋能高能效RISC-V计算

评论