0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

纽约大学与 NVIDIA 携手开发能够预测患者再入院概率的大型语言模型

NVIDIA英伟达 ? 来源:未知 ? 2023-06-14 18:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

刊登在《自然》(Nature)上的 AI 模型 NYUTron 已被部署到纽约大学朗格尼健康中心

从医院出院对病人来说是一座重要的里程碑,但有时这并不代表着他们已完全康复。在美国,有近 15% 的住院病人在首次出院后 30 天内再次入院,并且往往伴随着病情恶化与对患者及院方来说都更高的住院费用。

纽约大学学术医疗中心——纽约大学朗格尼健康中心(NYU Langone Health)的研究人员与 NVIDIA 专家携手开发了一个可预测病人 30 天内再入院风险以及其他临床结果的大型语言模型(LLM)。

这个刊登在科学期刊《自然》(Nature)上的 NYUTron 模型被部署在该医疗系统的六座住院楼中。它能够为医生提供 AI 所驱动的洞察,帮助他们识别需要通过临床干预的病人,以减少患者再入院概率。

纽约大学格罗斯曼医学院放射学和神经外科助理教授、NYUTron 的主要合作者 Eric Oermann 博士表示:“当你让病人出院时,肯定不希望他们需要再回来,或者其实在当时就应该延长病人的住院时间。借助 AI 模型的分析,我们很快就能帮助临床医生预防或解决那些使病人面临更高再入院风险的情况。”

到目前为止,该模型已被应用于纽约大学医疗系统中的 5 万多名出院患者。它会通过电子邮件告知医生再入院风险的预测。Oermann 的团队接下来正计划通过一项临床试验,测试依据 NYUTron 的分析所采取的干预措施是否能够降低再入院率。

应对短期再入院等风险

美国政府追踪 30 日再入院率并以此作为医院的护理质量指标。再入院率高的医疗机构会被处以罚款,这项制度能够激励医院改进其出院流程。

新出院的病人可能会因为感染、过度使用抗生素、过早移除手术引流管等原因而需要再入院。如果这些风险因素能够被更早地发现,医生就可以通过调整治疗计划或延长病人留院观察时间来进行干预。

Oermann 表示:“虽然自 20 世纪 80 年代以来就有了预测病人再入院的计算模型,但我们把它看作一项需要卫生系统规模临床文本语料库的自然语言处理任务。我们使用电子健康记录的非结构化数据训练我们的 LLM,检查它是否能够捕捉到人们之前没有考虑过的洞察。”

NYUTron 使用纽约大学朗格尼健康中心的 10 年健康记录进行了预训练。这些记录由近 40 万名病人超过 40 亿字的临床笔记组成。相比最先进的机器学习模型,该模型预测再入院的准确率提高了 10% 以上。

一旦该 LLM 为 30 天再入院的初始用例进行了训练,该团队就能在一周左右的时间里推出了其他四种预测算法,包括预测病人的住院时间、院内死亡的可能性以及病人保险理赔被拒的几率。

Oermann 表示:“经营一家医院在某些方面就像管理一家酒店。能够帮助医院更高效运营的洞察意味着医院能够腾出更多床位并为更多病人提供更高质量的照护。”

从训练到部署一个 LLM

NYUTron 是一个拥有数亿参数的 LLM。它在一个由NVIDIA A100 Tensor Core GPU 组成的大型集群上使用 NVIDIA NeMo Megatron 框架训练而成。

Oermann 表示:“如今,大部分关于语言模型的讨论都围绕着具有数十亿参数的超大型通用模型,这些模型使用数百乃至数千个 GPU 在混乱的数据集上训练而成。我们反其道而行之,使用在高度精炼的数据上训练的中等规模的模型来完成特定医疗任务。”

为了优化模型以便在现实医院进行推理,该团队开发了一个修改版的NVIDIA Triton 开源软件,以便利用NVIDIA TensorRT 软件开发工具套件简化 AI 模型部署。

Oermann 表示:“像这样的模型必须要高效运行才能被部署到实时医疗环境中。Triton 提供了你在一个推理框架中想要的一切,让我们的模型能够飞速运行。”

Oermann 的团队发现,在对他们的 LLM 进行预训练后,只需使用特定医院的数据在现场进行微调就能大幅提高准确率,这个特点可以帮助其他医疗机构部署类似的模型。

他表示:“并不是所有医院都拥有完全自主训练一个大型语言模型所需要的资源,但他们可以采用像 NYUTron 这样的预训练模型,然后通过云端的 GPU 使用少量本地数据样本对模型进行微调。这对于许多医疗机构来说都是可以做到的。”

如要进一步了解 NYUTron,请阅读《自然》期刊中的论文。点击“阅读原文”,点播观看 NVIDIA 与纽约大学的相关讲座。

扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


原文标题:纽约大学与 NVIDIA 携手开发能够预测患者再入院概率的大型语言模型

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3973

    浏览量

    94366

原文标题:纽约大学与 NVIDIA 携手开发能够预测患者再入院概率的大型语言模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 ?536次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron 开放数据集以及 ServiceNow 专业
    的头像 发表于 05-12 15:37 ?461次阅读

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,
    的头像 发表于 04-30 18:34 ?666次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时遇到错误。
    发表于 03-05 08:07

    语言模型的解码策略与关键优化总结

    本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面
    的头像 发表于 02-18 12:00 ?673次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    AI大语言模型开发步骤

    开发一个高效、准确的大语言模型是一个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,AI部落小编为大家详细阐述AI大
    的头像 发表于 12-19 11:29 ?988次阅读

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型将推动行业创新和效率提升。
    的头像 发表于 12-18 13:49 ?1346次阅读

    NaVILA:加州大学与英伟达联合发布新型视觉语言模型

    日前,加州大学的研究人员携手英伟达,共同推出了一款创新的视觉语言模型——NaVILA。该模型在机器人导航领域展现出了独特的应用潜力,为智能机
    的头像 发表于 12-13 10:51 ?754次阅读

    语言模型开发框架是什么

    语言模型开发框架是指用于训练、推理和部署大型语言模型的软件工具和库。下面,AI部落小编为您介绍
    的头像 发表于 12-06 10:28 ?595次阅读

    语言模型开发语言是什么

    在人工智能领域,大语言模型(Large Language Models, LLMs)背后,离不开高效的开发语言和工具的支持。下面,AI部落小编为您介绍大
    的头像 发表于 12-04 11:44 ?781次阅读

    Orange与OpenAI、Meta合作开发非洲语言AI大模型

    OpenAI和Meta将携手法国电信运营商Orange SA,共同开发针对非洲语言的人工智能大模型。该项目旨在解决非洲大陆数千种方言模型短缺
    的头像 发表于 12-02 11:00 ?701次阅读

    云端语言模型开发方法

    云端语言模型开发是一个复杂而系统的过程,涉及数据准备、模型选择、训练优化、部署应用等多个环节。下面,AI部落小编为您分享云端语言
    的头像 发表于 12-02 10:48 ?735次阅读

    语言模型如何开发

    语言模型开发是一个复杂且细致的过程,涵盖了数据准备、模型架构设计、训练、微调和部署等多个阶段。以下是对大语言
    的头像 发表于 11-04 10:14 ?659次阅读

    如何利用大型语言模型驱动的搜索为公司创造价值

    大型语言模型LLMs具有自动化内容创建、提高内容质量及多样化的潜力,可重塑企业与信息的交互方式。通过利用LLMs,企业能提升工作效率,降低运营成本,并获得深入洞察。来自EgeGürdeniz
    的头像 发表于 10-13 08:07 ?443次阅读
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>驱动的搜索为公司创造价值

    NVIDIA CorrDiff生成式AI模型能够精准预测台风

    NVIDIA GPU 上运行的一个扩散模型向天气预报工作者展示了加速计算如何实现新的用途并提升能效。
    的头像 发表于 09-13 17:13 ?1387次阅读