0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind推出的AlphaFold可以仅根据基因「代码」预测生成蛋白质的3D形状

KIyT_gh_211d74f ? 来源:lq ? 2018-12-05 15:51 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Alphabet(谷歌)旗下公司DeepMind的人工智能AlphaGo曾在国际象棋、围棋等项目中取得了超越人类的表现,其研究不仅震惊世界,也两次登上 Nature。如今,该公司已将人工智能技术应用到最具挑战性的科学研究问题中,其刚刚推出的 AlphaFold 可以仅根据基因「代码」预测生成蛋白质的 3D 形状。

DeepMind 表示,AlphaFold 是「该公司首个证明人工智能研究可以驱动和加速科学新发现的重要里程碑」。看来,人类医学研究要前进一步了。

2017 年 5 月,谷歌 DeepMind 人工智能项目 AlphaGo(执棋者:黄士杰博士)对战当时世界第一的围棋选手柯洁。

周日,在墨西哥坎昆举办的一场国际会议中,DeepMind 的最新 AI——AlphaFold 在一项极其困难的任务中击败了所有对手,成功地根据基因序列预测出蛋白质的 3D 形状。

「蛋白质折叠」是一种令人难以置信的分子折叠形式,科学界以外很少有人讨论,但却是一个非常重要的问题。生物由蛋白质构成,生物体功能由蛋白质形状决定。理解蛋白质的折叠方式可以帮助研究人员走进科学和医学研究的新纪元。

「对于我们来说,这真的是一个关键时刻,」DeepMind 联合创始人兼 CEODemis Hassabis表示,「这个项目就像灯塔,这是我们关于人和资源的首次重大投资,用于解决一个根本性的、现实世界的重要问题。」

在 2016 年 AlphaGo 击败李世乭后,DeepMind 就开始将目光转向蛋白质折叠。尽管实践证明,游戏是 DeepMind AI 项目的优秀试验场,但在游戏中取得高分并非他们的终极目标。「我们的目标从来就不是赢得围棋或雅达利比赛的胜利,而是开发能够解决蛋白质折叠这类问题的算法,」Hassabis 表示。

为什么要预测蛋白质结构

人体能够产生数万甚至数百万的蛋白质。每个蛋白质都是一个氨基酸链,而后者的类型就有 20 种。蛋白质可以在氨基酸之间扭曲、折叠,因此一种含有数百个氨基酸的蛋白质有可能呈现出数量惊人(10 的 300 次方)的结构类型。

蛋白质的 3D 形状取决于其中包含的氨基酸数量和类型,而这一形状也决定了其在人体中的功能。例如,心脏细胞蛋白质的折叠方式可以使血流中的任何肾上腺素都粘在它们上面,以加速心率。免疫系统中的抗体是折叠成特定形状的蛋白质,以锁定入侵者。几乎身体的每一种功能——从收缩肌肉和感受光线到将食物转化为能量——都和蛋白质的形状及运动相关。

通常情况下,蛋白质会呈现出能量效率最高的任何形状,但它们可能会纠缠在一起或者折叠错误,导致糖尿病、帕金森和阿茨海默症等疾病。如果科学家可以根据蛋白质的化学构成来预测其形状,他们就能知道它是做什么的,会如何出错并造成伤害,并设计新的蛋白质来对抗疾病或履行其它职责,比如分解环境中的塑料污染。

AI 如何改变研究方法?

正因为蛋白质的结构如此重要,在过去的五十年中,科学家已经能使用低温电子显微镜和核磁共振等实验技术确定蛋白质的形状,但是每一种方法都依赖大量的试验与误差反馈,每种结构可能需要花费数万美元、历时数年进行研究。因此生物学家转攻 AI 方法,以完成这一困难且单调的过程。

幸运的是,由于基因测序成本快速降低,基因组领域的数据非常丰富。因此在过去几年中,依赖于基因组数据的预测问题正越来越多地借助深度学习方法。DeepMind 非常关注这一问题,并提出了 AlphaFold,这一项工作目前已经提交到了Critical Assessment of Structure Prediction (CASP)。

DeepMind 用 AlphaFold 参加了 CASP,这是一年两次的蛋白质折叠奥运会,吸引了来自世界各地的研究小组。比赛的目的是根据氨基酸列表来预测蛋白质的结构,这些氨基酸列表会在几个月内每隔几天发送给参赛团队。这些蛋白质的结构最近已经通过费力又费钱的传统方法破解,但还没有公开。提交最准确预测的团队将获胜。

尽管是首次参加比赛,AlphaFold 就在 98 名参赛者中名列榜首,准确地从 43 种蛋白质中预测出了 25 种蛋白质的结构。而同组比赛中获得第二名的参赛者仅准确预测出了 3 种。值得一提的是,AlphaFold 关注从头开始建模目标形状,且并不使用先前已经解析的蛋白质作为模板。AlphaFold 在预测蛋白质结构的物理性质上达到了高度的准确性,然后基于这些预测可以使用两种不同的方法预测构建完整的蛋白质结构。

使用神经网络预测物理属性

AlphaFold 构建的模型都依赖深度神经网络,这些经过训练的神经网络可以从基因序列中预测蛋白质的属性。DeepMind 的研究人员表示,神经网络预测的蛋白质属性主要有:(a)氨基酸对之间的距离;(b)连接这些氨基酸的化学键及它们之间的角度。这些方法的首要进步就是对常用技术的提升,它们可以估计氨基酸对是否彼此接近。

为了构建 AlphaFold,DeepMind 在数千已知的蛋白质上训练了一个神经网络,直到它可以仅凭氨基酸预测蛋白质的 3D 结构。给定一种新的蛋白质,AlphaFold 利用神经网络来预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。接着,AlphaFold 调整初步结构以找到能效最高的排列。该项目花了两周时间来预测其第一个蛋白质结构,但现在几小时内就可以完成了。

根据神经网络预测的两种物理属性,DeepMind 还训练了一个神经网络以预测蛋白质成对残基(residues)之间距离的独立分布,这些概率能组合成估计蛋白质结构准确率的评分。此外,DeepMind 还训练了另一个独立的神经网络,该网络使用集群中的所有距离来估计预测的结构与实际结构之间的差距。

预测蛋白质结构的新方法

这些评分函数可以用来探索蛋白质内部,以找到与预测匹配的结构。DeepMind 的第一种方法建立在结构生物学的常用技术上,用新的蛋白质片段反复替换蛋白质整体结构的某个部分。他们训练了一个生成神经网络来创造新的片段,这些片段被用来不断提高蛋白质结构的评分。

先通过神经网络预测氨基酸之间的距离和化学键角度,然后再根据两种物理属性对结构进行评分,最后通过梯度下降优化评分。

第二种方法是通过梯度下降来优化评分,得到的结构高度精确。梯度优化被用在整个蛋白质链,而不是组装前必须单独折叠的片段,这种做法降低了预测过程的复杂性。

未来可期

首次涉足蛋白质折叠领域的成功表明,机器学习系统可以整合各种信息来源,帮助科学家快速找到各种复杂问题的创造性解决方案。人工智能已经通过 AlphaGo 和 AlphaZero 等系统掌握了复杂的游戏,与此类似,利用人工智能攻克基本科学问题的未来同样可期。

雷丁大学的研究人员 Liam McGuffin 在比赛中带领得分最高的英国学术团体。他表示,「DeepMind 今年似乎取得了更大的进展,我想进一步了解他们的方法。我们的资源并不充足,但我们仍然有很强的竞争力。」

「预测蛋白质折叠形状非常重要,对解决很多世纪难题有重大影响。这种能力可以影响健康、生态、环境,基本上可以解决任何涉及生命系统的问题。」

「包括我们在内的很多团队几年来一直都在使用基于机器学习的方法,而深度学习和人工智能的进步似乎也产生了越来越重要的影响。我对这个领域很乐观,我觉得我们会在 21 世纪 20 年代真正解决这个问题。」McGuffin 表示。

Hassabis 也表示还有很多工作要做。「我们还没有解决蛋白质折叠问题,目前只是迈出了第一步。这是一个极具有挑战性的问题,但我们有一个良好的体系,还有很多想法尚未付诸实践。」

蛋白质折叠的早期进展令人兴奋,它证明了人工智能对科学发现的效用。尽管在能够对疾病治疗、环境管理等方面产生量化影响之前,我们还有很多工作要做,但我们知道人工智能的潜力是巨大的。在一个专注于研究机器学习如何推进科学发展的专业团队的努力下,我们期待看到技术能够有所作为。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251601
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    11680

原文标题:AlphaGo之后,DeepMind重磅推出AlphaFold:基因序列预测蛋白质结构

文章出处:【微信号:gh_211d74f707ff,微信公众号:重庆人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    火极一时的AI蛋白质解析,怎么样了?

    AI蛋白质解析领域正在经历一场静水流深的变革
    的头像 发表于 07-27 17:18 ?1831次阅读
    火极一时的AI<b class='flag-5'>蛋白质</b>解析,怎么样了?

    NVIDIA助力影眸科技3D生成工具Rodin升级

    在当今数字化与 AI 飞速发展的时代,3D 生成技术正逐渐成为推动各行业创新的关键力量。影眸科技(上海)有限公司专注于 3D 生成领域的探索,积极推动领先实验室科研成果的民用化、商业化
    的头像 发表于 04-27 15:09 ?645次阅读

    IBM Spectrum LSF在生命科学和生物制药领域的应用

    随着基因测序技术的突破、蛋白质组学,分子动力学研究的深入以及 AI 技术的崛起,生命科学与生物制药领域正经历前所未有的变革。
    的头像 发表于 03-06 09:25 ?552次阅读

    3D IC背后的驱动因素有哪些?

    3D多芯片设计背后的驱动因素以及3D封装的关键芯片到芯片和接口IP要求。3D多芯片设计的市场预测显示,硅片的设计和交付方式将发生前所未有的变化。IDTechEx
    的头像 发表于 03-04 14:34 ?586次阅读
    <b class='flag-5'>3D</b> IC背后的驱动因素有哪些?

    华为依托昇腾AI打造蛋白结构预测工具

    蛋白质结构预测一直是“21世纪的生物物理学”最重要的课题之一,北京昌平实验室联合伙伴基于全场景AI框架“昇思MINDSPORE”开发的蛋白质结构预测模型在CAMEO竞赛拿下第一并霸榜四
    的头像 发表于 03-03 13:52 ?601次阅读

    SciChart 3D for WPF图表库

    DirectX 支持的 WPF 3D 图表和广泛的 API 完成工作。 WPF 3D 图表性能 我们传奇的 WPF 3D 图表性能由广泛的端到端性能优化、不安全代码、C++ 互操作、
    的头像 发表于 01-23 13:49 ?747次阅读
    SciChart <b class='flag-5'>3D</b> for WPF图表库

    腾讯混元3D AI创作引擎正式发布

    的AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业3D建模技能
    的头像 发表于 01-23 10:33 ?692次阅读

    腾讯混元3D AI创作引擎正式上线

    近日,腾讯公司宣布其自主研发的混元3D AI创作引擎已正式上线。这一创新性的创作工具,标志着腾讯在3D内容生成领域迈出了重要一步。 混元3D AI创作引擎的核心功能极为强大,用户只需通
    的头像 发表于 01-22 10:26 ?686次阅读

    Google DeepMind发布Genie 2:打造交互式3D虚拟世界

    在OpenAI宣布即将发布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基础世界模型——Genie 2。这款模型能够生成各种可控制动作、可玩的3D环境,为
    的头像 发表于 12-05 14:16 ?1195次阅读

    中兴通讯携手中国移动推出AI裸眼3D创新产品

    根据市场研究机构预测,预计到2027年,全球裸眼3D产品的出货量将达1.4亿台,而中兴通讯和中国移动正是这一趋势的积极推动者。
    的头像 发表于 10-15 10:05 ?1525次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    研究的进程。从蛋白质结构预测基因测序与编辑,再到药物研发,人工智能技术在生命科学的各个层面都发挥着重要作用。特别是像AlphaFold这样的工具,成功解决了困扰生物学界半个多世纪的
    发表于 10-14 09:21

    AI实火!诺贝尔又把化学奖颁给AI大模型

    蛋白质结构预测大模型——AlphaFold系列。 今年5月9日,谷歌DeepMind重磅发布了AlphaFold-3,能够精准
    的头像 发表于 10-10 10:38 ?472次阅读

    差示扫描量热仪测试蛋白质的应用案例

    过程中可能出现的吸热或放热峰,这些峰对应于角蛋白分子链的运动、微纤维的熔融、或蛋白质的变性等现象。 ? ?通过对比受延展和热处理前后的DSC曲线,研究人员可以了解这些处理对角蛋白复合物
    的头像 发表于 10-09 15:45 ?650次阅读
    差示扫描量热仪测试<b class='flag-5'>蛋白质</b>的应用案例

    创客中国AIGC专题赛冠军天鹜科技:AI蛋白质设计引领者

    源自自然的蛋白质与现代科技的创新精神相结合,打造蛋白质设计与应用的新范式。”在江西南昌举办的第九届“创客中国”生成式人工智能(AIGC)中小企业创新创业大赛中,上海天鹜科技有限公司(下称“天鹜科技”)分享了这一理念。 天鹜科技是
    的头像 发表于 09-18 12:04 ?737次阅读
    创客中国AIGC专题赛冠军天鹜科技:AI<b class='flag-5'>蛋白质</b>设计引领者

    EvolutionaryScale推出基于NVIDIA GPU模型的新型蛋白质研究方案

    EvolutionaryScale 于 6 月 25 日发布了第三代 ESM 模型 ESM3,该模型可同时对蛋白质的序列、结构和功能进行推理,为蛋白质研发工程师提供了一个可编程的平台。
    的头像 发表于 08-23 16:45 ?1157次阅读