0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BioNeMo框架将为生物学研究提供加速

NVIDIA英伟达 ? 来源:NVIDIA英伟达 ? 作者:NVIDIA英伟达 ? 2022-09-26 09:23 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

领先的制药公司、生物技术初创企业和前沿生物研究人员正在使用 NVIDIA BioNeMo LLM 服务和框架来开发用于生成、预测和理解生物分子数据的 AI 应用。

科学家们致力于探索 DNA、蛋白质和其他生命体的“基础构建”,以期获得全新的洞察,而今日在 NVIDIA GTC 上发布的 NVIDIA BioNeMo 框架将为其研究提供加速。

NVIDIA BioNeMo 框架用于训练和部署超算规模的大型生物分子语言模型,帮助科学家更好地了解疾病,并为患者找到治疗方法。该大型语言模型(LLM)框架将支持化学、蛋白质、DNA 和 RNA 数据格式。

NVIDIA BioNeMo 是 NVIDIA Clara Discovery 药物研发框架、应用和 AI 模型集的一部分。

正如 AI 通过 LLM 来学习如何理解人类语言,该框架也在学习生物学和化学语言。NVIDIA BioNeMo 使基于生物分子数据的大规模神经网络训练更为轻松,助力研究人员发现生物序列中的新模式并获得新洞察。研究人员可将这些洞察与生物特性或功能乃至人类健康状况联系起来。

NVIDIA BioNeMo 框架使科学家能够使用更大的数据集来训练大规模语言模型,打造出性能更强大的神经网络。NVIDIA 的 GPU 优化软件中心——NVIDIA NGC 上将提供该框架的抢先体验。

除语言模型框架之外,NVIDIA BioNeMo 还提供一项云 API 服务,该服务将支持越来越多的预训练 AI 模型。

BioNeMo 框架支持更大的模型

和更准确的预测

如今,使用自然语言处理模型来处理生物数据的科学家一般会训练相对较小、需要自定义预处理的神经网络。通过 BioNeMo,科学家可将其扩展为具有数十亿参数的 LLM,捕捉分子结构、蛋白质溶解度等信息。

BioNeMo 是 NVIDIA NeMo Megatron 框架的扩展,可实现大规模自监督语言模型的 GPU 加速训练。这一针对特定领域的框架支持以 SMILES 化学结构标记表征的分子数据、以及以 FASTA 氨基酸和核酸序列字符串表征的分子数据。

OpenFold 联盟创始成员、哥伦比亚大学系统生物学系助理教授 Mohammed AlQuraishi 表示:“该框架使整个医疗和生命科学行业的研究人员都能利用快速增长的生物和化学数据集。这样就能更轻松地发现和设计出精准针对疾病分子特征的治疗方法。”

BioNeMo 服务提供用于化学和生物学的 LLM

NVIDIA BioNeMo LLM 服务将为希望快速掌握数字化的生物学和化学领域应用的 LLM 的开发者提供四个预训练语言模型。这些模型针对推理进行了优化,并将通过 NVIDIA DGX Foundry 上运行的云端 API 提供抢先体验。

ESM-1:这一最初由 Meta AI Labs 发布的蛋白质 LLM 能够处理氨基酸序列,最终生成用于预测各种蛋白质特性和功能的表征。它还提高了科学家理解蛋白质结构的能力。

OpenFold:这是由学术界和产业界共同成立的 Openfold 联盟创建的 sota 蛋白质建模工具,它将可以通过 BioNeMo 服务提供其开源 AI 工作流程。

MegaMolBART:这一基于 14 亿分子训练而成的生成式化学模型可用于反应预测、分子优化和新分子的生成。

ProtT5:该模型是在慕尼黑工业大学 RostLab 的带领下合作开发的,NVIDIA 也是该项目的参与者之一。PortT5 将 ESM-1b 等蛋白质 LLM 的功能扩展到序列生成。

未来,使用 BioNeMo LLM 服务的研究人员将能够通过 fine-tuning 以及 p-tuning 等新技术,在几小时内完成 LLM 模型的自定义,提高应用的准确性。相比原来动辄数百万个样本的数据集,p-tuning 训练方法只需要包含几百个样本的数据集。

初创企业、研究人员和制药公司

纷纷采用 NVIDIA BioNeMo

生物技术和制药行业的专家正在采用 NVIDIA BioNeMo,为新药研发提供支持。

阿斯利康和 NVIDIA 使用 Cambridge-1 超级计算机开发了 BioNeMo LLM 服务中的 MegaMolBART 模型。这家全球生物制药公司将使用 BioNeMo 框架,在涵盖小分子和蛋白质的数据集上训练一些全球最大的语言模型。该数据集日后还将涵盖 DNA。

麻省理工学院和哈佛大学旗下博德研究所的研究人员正在与 NVIDIA 一起使用 BioNeMo 框架来开发新一代 DNA 语言模型。这些模型将被整合至 Terra 中。Terra 是一个由博德研究所、微软和 Verily 共同开发的云平台,生物医学研究人员能够通过该平台,安全、大规模地共享、访问和分析数据。这些 AI 模型还将被添加到 BioNeMo 服务集中。

OpenFold 联盟计划使用 BioNeMo 框架来推进其 AI 模型开发工作。这些模型可根据氨基酸序列来预测分子结构,并达到接近实验的准确性。

Peptone 专注于构建固有无序蛋白质(缺乏稳定 3D 结构的蛋白质)的模型。该公司正与NVIDIA 一起使用同样作为 BioNeMo 基础的 NeMo 框架来开发 ESM 模型版本。该项目计划在 NVIDIA 的 Cambridge-1 超级计算机上运行,将推动 Peptone 的新药研发工作。

位于芝加哥的生物技术公司 Evozyne 将工程与深度学习技术相结合,致力于设计能够解决长期治疗和可持续发展难题的新型蛋白质。

Evozyne 联合创始人兼计算主管 Andrew Ferguson 表示:“BioNeMo 框架使我们能够在设计-构建-测试周期内,高效利用 LLM 的力量,基于数据进行蛋白质设计。这将直接影响我们新型功能性蛋白的设计,并将在人类健康和可持续发展方面得以应用。”

NVIDIA 初创加速计划成员、生物技术初创企业 Peptone 的机器学习负责人 Istvan Redl 表示:“随着大型语言模型在蛋白质领域的应用日益广泛,高效训练 LLM 并快速调整模型架构的能力变得非常重要。我们相信 BioNeMo 框架将满足可扩展性和快速实验这两大工程方面的需求。”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106657
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281399
  • 生物学
    +关注

    关注

    0

    文章

    26

    浏览量

    13089

原文标题:GTC22 | NVIDIA 将大型语言模型扩展到生物学领域

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA全栈加速代理式AI应用落地

    在近期举办的 AWS 中国峰会上,NVIDIA 聚焦于“NVIDIA 全栈加速代理式 AI 应用落地”,深入探讨了代理式 AI (Agentic AI) 技术的前沿发展以及在企业级应用中的深远影响。本文
    的头像 发表于 07-14 11:41 ?587次阅读

    高压放大器在粒子加速研究中的应用

    粒子加速器是现代科学研究中不可或缺的大型实验装置,广泛应用于物理学、化学、材料科学、生物学等多个领域。其核心原理是利用电场和磁场对带电粒子进行加速和约束,使粒子达到极高的能量,从而为
    的头像 发表于 06-19 17:09 ?221次阅读
    高压放大器在粒子<b class='flag-5'>加速</b>器<b class='flag-5'>研究</b>中的应用

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以
    的头像 发表于 05-28 10:06 ?660次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的发展。
    的头像 发表于 05-27 14:03 ?413次阅读

    NVIDIA将为每家AI工厂提供网络安全

    NVIDIA DOCA Argus 框架可检测 AI 工作负载中的威胁并对之做出响应,同时与企业安全系统无缝集成,从而提供实时洞察。
    的头像 发表于 05-07 15:11 ?476次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>将为</b>每家AI工厂<b class='flag-5'>提供</b>网络安全

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 ?669次阅读

    利用NVIDIA DPF引领DPU加速云计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供
    的头像 发表于 01-24 09:29 ?801次阅读
    利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云计算的未来

    简述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了对NVIDIA Isaac的重要更新。NVIDIA Isaac 是一个由加速库、应用框架和 AI
    的头像 发表于 01-17 09:57 ?1111次阅读
    简述<b class='flag-5'>NVIDIA</b> Isaac的重要更新

    NVIDIA 携手行业领先机构推动基因组、药物发现及医疗健康行业发展

    ——NVIDIA 今日宣布新的合作伙伴关系,旨在通过加速药物发现、提升基因组研究,以及利用代理式和生成式 AI 开创先进医疗服务,推动规模达 10 万亿美元的医疗健康与生命科学产业的变革。 ? AI、
    发表于 01-14 13:39 ?315次阅读
    <b class='flag-5'>NVIDIA</b> 携手行业领先机构推动基因组<b class='flag-5'>学</b>、药物发现及医疗健康行业发展

    微流控技术的生物学应用

    微流控技术为在推动生物学众多领域的强大工具做出了巨大贡献。随着用于微通道中流体的注射、混合、泵送和存储的新器件和工艺的发展,近年来微流控系统在化学和生物化学中的应用越来越广泛。 尽管微流控技术近年来
    的头像 发表于 12-01 21:50 ?544次阅读

    生物传感器:科技前沿的生物监测利器

    和品质。生物学研究生物传感器可用于细胞信号传导、蛋白质相互作用等生物过程的研究为生物学
    的头像 发表于 11-20 15:12 ?3928次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 ?1000次阅读

    NVIDIA 推出 BioNeMo 开源框架,扩大全球生物制药和科学行业的数字生物学研究规模

    阿贡国家实验室和更广泛的生物技术社群提供了一个企业级开源解决方案,使研究人员能够在本来不具备足够的计算专业知
    发表于 11-19 14:01 ?337次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>BioNeMo</b> 开源<b class='flag-5'>框架</b>,扩大全球<b class='flag-5'>生物</b>制药和科学行业的数字<b class='flag-5'>生物学</b><b class='flag-5'>研究</b>规模

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    的效率,还为科学研究提供了前所未有的洞察力和精确度。例如,在生物学领域,AI能够帮助科学家快速识别基因序列中的关键变异,加速新药研发进程。 2. 跨学科融合的新范式 书中强调,人工智能
    发表于 10-14 09:12

    生成式AI模型推进数字生物学发展

    Meta 的开放大语言模型(已优化并可作为 NVIDIA NIM 下载)为数字健康和生命科学工作流提供动力支持。
    的头像 发表于 09-13 17:18 ?1153次阅读