0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何最大化推理性能?Triton 社区技术交流活动与您畅聊

NVIDIA英伟达企业解决方案 ? 来源:未知 ? 2023-02-15 16:10 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由蚂蚁集团和 NVIDIA 携手举办的“Triton Meetup 2023”将于 2 月 25 日在北京举行。该活动是 Triton 社区首次正式举办的线下技术交流活动。来自美团、京东、蚂蚁、NVIDIA 的技术专家将带来 AI Infra推理引擎相关的专题分享,包括目前各企业面临的模型推理挑战、Triton 的应用及落地的具体方案等,现身说法,干货十足。此外,还有来自蔚来的特邀嘉宾,带来“AI 推理服务的当下与未来”圆桌主题讨论,欢迎到现场的小伙伴积极参与!

活动地点

北京 BCos 共享办公--多功能厅

(北京 WFC 环球金融中心办公店)

活动时间

2023 年 2 月 25 日

14:00 - 18:00

活动报名

长按扫描下方二维码

或点击文末“阅读原文

即可预约报名!

890b3a2e-ad07-11ed-bfe3-dac502259ad0.png

Triton Meetup 2023 活动流程

14:00 - 14:05

开场

14:05 - 14:45

NVIDIA Triton Inference Server的现在和未来

14:45 - 15:25

Triton 在蚂蚁全场景落地的优化

15:25 - 15:40

NVIDIA & 蚂蚁开源社区共建启动仪式

15:40 -16:20

Triton 在美团数据中心的应用

16:20 - 17:00

Triton 在京东零售的应用与实践

17:00 - 17:20

圆桌讨论:AI 推理服务的当下与未来

下面一起来看看嘉宾阵容吧!

议题一:NVIDIA Triton
Inference Server 的现在和未来

申意

NVIDIA 解决方案架构师

891f8a88-ad07-11ed-bfe3-dac502259ad0.png

负责为消费互联网行业提供 GPU 计算解决方案。包括编解码,数据前后处理,模型推理及服务化等。

议题简介:

  • Triton 简介

  • Triton 重要 Feature 简介和 Roadmap 更新

  • Triton 的成功案例

议题二:Triton 在蚂蚁全场景落地的优化

饶星

蚂蚁集团高级技术专家

89495a84-ad07-11ed-bfe3-dac502259ad0.jpg

蚂蚁集团推理团队技术负责人,负责蚂蚁集团全部业务场景的推理服务,长期专注在推理相关的架构和性能优化。

议题简介:

  • Triton 在搜索、推荐、广告业务场景的解决方案

  • Triton 在认知业务的解决方案

  • 结合业务场景,蚂蚁进一步的优化方案

议题三:Triton 在美团数据中心的应用

王新

美团机器学习平台预测引擎团队

技术负责人

8968707c-ad07-11ed-bfe3-dac502259ad0.png

美团机器学习平台预测引擎团队技术负责人,长期专注于机器学习预测引擎相关的开发工作。

议题简介:

  • 机器学习模型在美团落地的痛点

  • Triton 落地的具体方案

  • 使用 Triton 的业务收益与效果

议题四:Triton 在京东零售的应用与实践

杨培军

京东零售算法中台技术架构师

89a674c6-ad07-11ed-bfe3-dac502259ad0.jpg

长期从事机器学习平台/深度学习推理加速和框架的研发,曾负责阿里妈妈搜索广告预估平台、Bigo 机器学习平台的建设。

议题简介:

  • 京东零售的多元化算法需求给模型推理带来的挑战

  • 介绍京东算法中台在面向 CV/NLP 场景基于 Triton 二次开发的高性能推理框架

  • 阐述推理框架的架构演进和性能优化工作

圆桌讨论:AI 推理服务的当下与未来

特邀嘉宾:郭城

蔚来自动驾驶研发平台 (NADP)资深工程师

89baadc4-ad07-11ed-bfe3-dac502259ad0.jpg

负责搭建 NADP 云上推理系统,模型 CICD。

交通指引 & 防疫政策

1. 自驾到场:

开车行进至“环球金融中心”,在大楼南侧地下停车场进入。

2. 地铁前往:

地铁 10 号线至“金台夕照”站,从 A 口出,步行 3-5 分钟,从环球金融中心南门进入。


原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3983

    浏览量

    94620

原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    泰科电子与宝马中国成功举办技术交流活动

    泰科电子(TE Connectivity,以下简称“TE”)汽车事业部中国区走进宝马中国,成功举办技术交流活动。此次活动聚焦汽车电动化、智能化数据连接和最新汽车创新线束技术连接方案三大技术
    的头像 发表于 08-16 11:14 ?804次阅读

    帝奥微出席东风汽车供应链技术交流活动

    近日, 由东风汽车集团有限公司、中国电动汽车百人会主办的汽车产业“提链行动”之走进东风汽车供应链技术交流活动在武汉取得圆满结束。帝奥微携多品类核心汽车应用产品与方案精彩亮相。
    的头像 发表于 08-04 11:18 ?537次阅读

    迈来芯携手伯特利举办技术交流活动

    近日,迈来芯(Melexis)携手伯特利(Bethel)举办 “技术交流日”活动,聚焦前沿科技与深度合作。
    的头像 发表于 07-26 15:33 ?765次阅读

    帝奥微邀相约东风汽车供应链技术交流活动

    汽车供应链技术交流活动,由中国电动汽车百人会携手东风汽车联合发起,S100具体承办。本次活动致力于促进汽车供应链上下游资源的高效合作,推动新产品、新技术商业化应用,更好地服务企业战略
    的头像 发表于 07-24 18:03 ?571次阅读

    咱们是否有技术交流群?

    购买了咱们得开发板,想寻找咱们是否有技术交流群?
    发表于 07-08 19:06

    BlackBerry QNX出席加中汽车新势力企业交流活动

    近日,由加拿大驻华大使馆主办的“加中汽车新势力企业交流活动”在北京成功举办。此次活动旨在促进加拿大与中国新能源汽车产业间的相互了解,挖掘潜在合作机遇。
    的头像 发表于 06-19 13:47 ?522次阅读

    震有科技出席一带一路国家云计算交流活动

    近日,来自南非、印度尼西亚、埃塞俄比亚、坦桑尼亚、蒙古、格林纳达、埃及、塔吉克斯坦等国家的政府及企业代表团齐聚一堂,围绕云计算技术应用、数字化转型及国际合作等议题展开深入探讨。作为“一带一路”框架下的重要技术交流活动,本次活动
    的头像 发表于 04-30 16:02 ?390次阅读

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    Triton 推理服务器的后续产品,NVIDIA Dynamo 是一款全新的 AI 推理服务软件,旨在为部署推理 AI 模型的 AI 工厂最大化
    的头像 发表于 03-20 15:03 ?768次阅读

    开源小满社区首期技术交流会顺利举行

    近日,开源小满(EasyXMen)社区第1期技术交流会在上海顺利举行。本次会议以“小满社区软件功能及治理方案”为主题,来自整车厂、零部件供应商、软件企业、芯片企业、高校及行业组织等31家单位的48位代表齐聚一堂,共同探讨开源小满
    的头像 发表于 03-06 10:25 ?632次阅读

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 ?885次阅读
    使用NVIDIA<b class='flag-5'>推理</b>平台提高AI<b class='flag-5'>推理性能</b>

    解锁NVIDIA TensorRT-LLM的卓越性能

    Batching、Paged KV Caching、量化技术 (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能,确保的 NVIDIA GPU 能发挥出卓越的推理性能
    的头像 发表于 12-17 17:47 ?1075次阅读

    光伏发电如何实现能效最大化

    光伏发电实现能效最大化是一个综合性的问题,需要从多个方面入手。以下是一些关键措施: 一、选用优质设备 太阳能板 :选用具有高光电转化效率和稳定性的太阳能板是基础。例如,单晶硅太阳能板通常比多
    的头像 发表于 12-05 11:06 ?1081次阅读

    赛力斯与奥托立夫技术交流日顺利举行

    近日,奥托立夫首次走进赛力斯,在其重庆总部举办了一场规模盛大的全方位技术交流活动,并把前沿的安全黑科技和安全系统集成解决方案带到了赛力斯。借此活动,双方加深了对彼此在研发与市场方向的认知,深化了合作关系,共同携手打造了一场高水准、高品质、高规格的汽车安全产业
    的头像 发表于 12-02 14:25 ?1055次阅读

    润和软件2024南京开源生态发展交流活动回顾

    基金会OpenHarmony项目群初始成员单位、A类捐赠人、核心共建单位,以及南京本地引领开源生态发展与技术创新的重点企业,与母公司江苏润和软件股份有限公司(以下简称“润和软件”)共同参与承办“2024南京开源生态发展交流活动”,并受邀出席“2024‘才汇金陵’高层次软件
    的头像 发表于 09-23 16:03 ?1494次阅读

    开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

    近期,第五代英特尔?至强?可扩展处理器通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。英特尔成为首批通过AISBench大语言模型(LLM)推理性能测试的企业
    的头像 发表于 09-06 15:33 ?975次阅读
    开箱即用,AISBench测试展示英特尔至强处理器的卓越<b class='flag-5'>推理性能</b>