0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

vLLM Meetup上海站成功举办

沐曦MetaX ? 来源:vLLM ? 2025-08-27 13:47 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:vLLM

2025年8月23日,vLLM Meetup上海站成功举办。活动汇聚技术专家、社区开发者及行业用户,围绕vLLM(一种用于大型语言模型的高性能推理引擎)的技术进展、生态建设及应用展开深度探讨。会议涵盖社区贡献指南、分布式推理架构、多模态模型集成等前沿议题,现场互动热烈,并提出每年举办vLLM Con大会的倡议,为AI推理领域的技术落地注入新动能。

本次Meetup由沐曦与红帽公司联合主办,红帽作为全球开源社区vLLM的重要贡献者,长期参与上游协作并分享实践经验,推动社区发展;沐曦则结合国产硬件优势,积极探索vLLM在本土计算平台上的适配与应用。沐曦开源生态总监章津楠与红帽亚太CTO办公室首席架构师张家驹共同开场,对到场嘉宾及观众表示欢迎。活动设置五大核心议题,并穿插开发者提问环节,最终以沐曦联合创始人、CTO兼首席软件架构师杨建博士的开源生态趋势分享及书籍签赠环节收尾,现场气氛活跃。

活动核心环节围绕五大技术方向展开,专家团队通过案例解析与方案演示,系统呈现vLLM在社区生态、分布式架构、多模态集成等领域的创新实践。

在题为《vLLM: Building, Testing and Contributing》演讲中, vLLM社区贡献者、Red Hat资深专家Daniele Trifirò深入剖析了vLLM社区的发展现状,为爱好者及开发者提供了系统性指南。他详细阐述了项目构建流程、关键测试规范,并指导开发者如何高效贡献代码。通过丰富的代码实例、实践案例及参考链接,演讲极大降低了初学者入门门槛,获得现场开发者高度认可。

在《Disaggregated P/D for Wide EP》主题分享中,vLLM社区贡献者、Red Hat技术专家Nicolò Lucchesi重点介绍了利用llm-d实现vLLM分布式推理的方案,核心目标是通过预填充/解码(P/D)解耦与宽专家并行(EP)扩展大模型推理能力,尤其针对长上下文和混合专家(MoE)模型场景,关键技术方案包括P/D解耦部署、通过NIXL实现高效KV Cache传输、支持预填充(P)与解码(D)阶段采用不同TP并行度、将MoE模型中的专家分布至不同GPU等实现细节。

百度高级产品经理王凯在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演讲中,系统解析了百度ERNIE 4.5多模态模型与vLLM的集成实践。内容涵盖ERNIE 4.5 的特性、与 vLLM 集成的原因以及 vLLM 为 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同时还介绍了正在进行的开发工作,例如专家并行性负载均衡和视觉-语言支持。

Mooncake核心开发者苏金阳在《Mooncake x LMCache 性能优化分享》的主题分享中重点介绍了 Mooncake(特别是其传输引擎和存储)与 LMCache 的集成,以在 vLLM 中实现高性能 KV Cache 重用。LMCache 被认为是用于 KV Cache 管理(卸载、重用、P/D 分离、RAG 缓存)的流行 vLLM 社区扩展。此次集成旨在提高数据分发效率和整体系统性能。

沐曦vLLM推理引擎专家张廉洁在《vLLM-metax: Bridging CUDA to MetaX MACA》演讲中,详细介绍了vLLM-metax 如何通过 cu-bridge 在 MACA 上实现接近零成本的 CUDA 执行,允许在不修改源代码的情况下进行原生编译。同时还解释了在 vLLM 中使用插件架构支持 MetaX 的方式,概述了修补方法(patch补丁和文件替换)和限制。演讲还公布了2025年路线图。

提问环节中,开发者围绕社区贡献规范、分布式推理落地、国产硬件支持等议题提出建议,嘉宾以技术细节回应,讨论贯穿全场。

本次活动彩蛋,沐曦联合创始人、CTO兼首席软件架构师杨建博士惊喜亮相现场,他不仅生动分享了沐曦在开源生态和vLLM推理技术的最新趋势,还热情地为获得《沐曦异构并行计算软件栈》书籍的幸运观众亲笔签名留念。

本次Meetup不仅展示了vLLM在分布式推理、多模态集成及硬件适配领域的最新成果,更通过技术交流与生态合作,为AI推理引擎的规模化应用提供了实践范本。行业专家与开发者的深度互动,进一步强化了vLLM在开源社区的技术影响力,为下一代AI基础设施的研发奠定基础。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52815

    浏览量

    445592
  • 开源
    +关注

    关注

    3

    文章

    3803

    浏览量

    44200
  • 模型
    +关注

    关注

    1

    文章

    3560

    浏览量

    50822

原文标题:vLLM Meetup上海站圆满落幕

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025开放原子园区行上海成功举办

    近日,以“开源赋能智能,协同创新共筑AI未来”为主题的开放原子“园区行”(上海)在上海市徐汇区成功举办。本次活动由开放原子开源基金会与
    的头像 发表于 07-07 18:12 ?616次阅读

    2025开放原子校源行广东海洋大学活动成功举办

    近日,由开放原子开源基金会主办,广东海洋大学和北京中软国际教育科技股份有限公司承办的“开放原子校源行”(广东海洋大学)活动成功举办
    的头像 发表于 06-30 10:02 ?395次阅读

    2025开放原子校源行太原成功举办

    近日,开放原子“校源行”(太原)在中北大学成功举办。工业和信息化部信息技术发展司、山西省工信厅、山西省教育厅,以及地方工信部门、高校、头部科技企业代表等600余人共话开源生态,推进开源教育。
    的头像 发表于 06-28 17:44 ?800次阅读

    Wolfspeed助力捷豹TCS车队FE上海成功卫冕

    !从第一回合遭遇低谷,到第二回合成功卫冕,捷豹 TCS 车队逆风翻盘!“KIWI”组合上海两年两冠,续写传奇!
    的头像 发表于 06-06 09:12 ?508次阅读

    2025年恩智浦创新技术峰会上海圆满落幕

    日前,2025年恩智浦创新技术峰会(上海成功举办!本次活动聚焦工业和物联网、汽车电子两大应用市场,全面展示了恩智浦及生态合作伙伴的前沿技术和方案,打造了一场精彩纷呈的技术盛宴,助力
    的头像 发表于 05-27 14:40 ?835次阅读

    在openEuler上基于vLLM Ascend部署Qwen3

    近日,阿里巴巴正式发布新一代Qwen大语言模型系列(Qwen3与Qwen3-MoE),在模型规模与性能上实现多方面升级。openEuler社区团队与vLLM社区通力合作,在第一时间完成Qwen3模型
    的头像 发表于 05-07 14:44 ?983次阅读
    在openEuler上基于<b class='flag-5'>vLLM</b> Ascend部署Qwen3

    2025年开放原子校源行清华大学成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华)在清华大学成功举办
    的头像 发表于 04-22 16:46 ?499次阅读

    恩智浦与Zephyr赋能安全可靠的嵌入式开发

    日前,恩智浦联手Zephyr实时操作系统成功举办了Zephyr Project Meetup上海的活动,6场主题演讲以及深入的现场技术交流
    的头像 发表于 04-21 10:26 ?747次阅读

    开放原子园区行太原成功举办

    近日,由开放原子开源基金会、山西省工业和信息化厅、山西转型综合改革示范区管委会联合主办的开放原子“园区行”(太原)活动在太原市同昌创业园成功举办
    的头像 发表于 04-02 16:54 ?574次阅读

    2025芯来RISC-V技术研讨会苏州成功举办

    近日,2025芯来RISC-V技术研讨会@苏州活动成功举办。此次苏州研讨由芯来科技与劳特巴赫中国联合主办,同时也感谢上海开放处理器产业创
    的头像 发表于 03-26 11:50 ?807次阅读

    索尼新品品鉴会上海成功举办

    近日,索尼携手《家庭影院技术》杂志成功举办了“把影院带回家,索尼家用投影P9(VPL-XW8100)新品品鉴会”全国巡展的上海。来自华东地区众多行业人士和影音爱好者,共同见证了索尼“
    的头像 发表于 12-19 15:20 ?708次阅读

    vLLM项目加入PyTorch生态系统,引领LLM推理新纪元

    近日,vLLM项目宣布正式成为PyTorch生态系统的一部分,标志着该项目与PyTorch的合作进入了一个全新的阶段。本文将从以下几个方面进行介绍,特别提醒:安装方案在第四个部分,可选择性阅读
    的头像 发表于 12-18 17:06 ?1022次阅读
    <b class='flag-5'>vLLM</b>项目加入PyTorch生态系统,引领LLM推理新纪元

    东方通联合openEuler社区即将开启云原生开源中间件 Meetup北京

    ! openEuler社区云原生开源中间件Meetup北京将于12月27日举办,由东方通与openEuler社区携手主办。此次交流活动特邀多位业内专家,分享实战案例与前沿技术解析,为技术爱好者、行业从业者、高校学生等加油充电,
    的头像 发表于 12-17 14:58 ?838次阅读

    OpenHarmony Meetup 2024城市巡回武汉圆满落幕

    OpenHarmony Meetup 2024城市巡回武汉站在武汉大学圆满落幕。作为本年度的活动第一,本次巡回以最新前沿技术分享以及企业成果转化为核心,展示了 OpenHarmony 技术的不断迭代更新,吸引了众多的企业和技
    的头像 发表于 09-14 14:55 ?1488次阅读

    飞凌嵌入式受邀参加openEuler Embedded Meetup(广州

    9月12日下午,由openEuler社区主办的openEuler Embedded Meetup(广州)在华南理工大学举行,此次交流会旨在深入探讨嵌入式技术的最新趋势,加强产学研的交流与合作,吸引
    的头像 发表于 09-13 09:45 ?1137次阅读
    飞凌嵌入式受邀参加openEuler Embedded <b class='flag-5'>Meetup</b>(广州<b class='flag-5'>站</b>)