0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT:神经网络通过细微特征预测是否会出现乳腺癌,远超传统预测方法

电子工程师 ? 来源:YXQ ? 2019-05-13 15:46 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着近年来乳腺癌的发病率逐渐上升,在现代医学的众多研究领域中,如何尽早发现和治疗乳腺癌,早已成为了一个十分重要的核心课题。

近日,麻省理工学院计算机科学与人工智能实验室(CSAIL)和马萨诸塞州综合医院(MGH)合作,共同打造了一个新的深度学习模型,可以通过分析乳房 X 光图像,找出人眼不易察觉的特征和规律,从而预测女性是否可能在未来五年内罹患乳腺癌注意:是预测而非诊断

训练结果显示,该模型的预测准确率约为31%,远超传统预测方法的18%。研究团队认为,以深度学习驱动的预测系统有望推动新的乳腺癌筛查计划,可以将基于年龄的传统筛查建议,变成基于风险因素的更加科学的个性化筛查建议。

该研究成果以论文的形式发表于期刊Radiology上。

不完善的传统筛查建议

乳腺 X 线摄影技术,是目前医疗领域最常用的乳腺癌临床检查方法,经过一个世纪的发展,已被证明可以降低乳腺癌的死亡率。但由于 X 光的强辐射性和乳腺本身的敏感性,业内对筛查频率和何时开始仍有争议。

美国癌症协会建议,所有女性都应该从 45 岁开始进行年度筛查。不过因为每个人的体质和生长环境不同,罹患乳腺癌的风险也不一样,以年龄划分筛查频率过于泛化,很容易错过乳腺癌的早期状态,错失最佳的治疗时机(早期乳腺癌的5年生存率高达 98-100%)。

图 | 乳腺X线摄影技术

在麻省理工学院的研究人员看来,相比采用一刀切的方式,如果能够预测出女性罹患乳腺癌的风险系数,就可以制定更完善的个性化筛查方案,比如让高危人群在 30 多岁时就每年检查一次,低危人群则每三年检查一次,那么或许可以将更多的乳腺癌扼杀在摇篮中,抑制它的发病率增长趋势。

这种预测类型的任务,非常适合使用深度学习技术。实际上,已经有很多关于乳腺癌的研究团队,正在尝试使用人工智能和深度学习,帮助他们诊断乳腺癌(详情请见:神经网络的巧妙组合,乳腺癌诊断准确率竟媲美专业医生)。

与众不同的是,MIT团队想要打造的是预测模型,并非诊断模型。换句话说,当 X 光照片还没有出现乳腺癌的症状时,诊断模型只能给出没有患病的结论,但预测模型应该给出未来一段时间内的患病概率,其难度可想而知。

设计预测模型

研究人员首先联合了美国马萨诸塞州综合医院,获得了超过 6 万名患者的 9 万余张乳房 X 光图像,以及她们是否在 5 年内被诊断出乳腺癌的信息,其中有 2.1 万人没有跟踪检查信息或者出现了其它癌症,因此被排除在外。由于很多女性进行了多次 X 光扫描和跟踪筛查,所以每一次扫描的图像都会被分离出来,成为一个独立的扫描案例。

之后,他们总结出了一系列与乳腺癌和个体有关的风险因素,包括族裔、年龄、体重和身高等基本信息,还有初次月经年龄、乳房密度、是否生产、初次怀孕年龄、是否患有卵巢癌、家族乳腺癌史等高度差异化的信息,甚至精确到家族中患有乳腺癌的是父母,姐妹,还是兄弟。

图 | 神经网络通过细微特征预测是否会出现乳腺癌(来源:MIT)

获得这些精准信息,可以让预测模型考虑的因素更加全面。每一个风险因素都会经过独热编码(one-hot encoding)——一种在机器学习中常见的变量转换机制,可以将某一变量的状态用 0 和 1 组成的二进制向量表示出来——将所有编码整合起来,就组成了一个大的风险因素向量,作为逻辑回归模型(Logistic Regression,预测模型的一部分)的输入值。

在此基础上,研究人员又开发了一套以卷积神经网络(CNN)为核心的图片识别模型,使用的是开源的预训练模型 ResNet-18。他们并没有根据图片分辨率变化调整模型,而是直接以1664 x 2048 像素的乳房 X 光图片作为输入值。

最后,他们整合了逻辑回归和图像识别两个模型,制作了一个混合模型(Hybrid Model)。结合风险因素和图像信息,该模型开始学习预测五年内是否会出现乳腺癌。

训练和测试结果显示,混合模型的 3-5 年患癌预测准确率约为 31.2%。乍看之下这一数字似乎不够亮眼,但要知道,目前业界主流的Tyrer-Cuzick(TC)乳腺癌风险预测模型,在相同测试中的准确率只有 18.2%,不及麻省理工学院深度学习模型的六成。

图 | 四套模型的准确率(AUC)对比:TC传统模型,逻辑回归模型,图像识别模型和混合模型(来源:MIT/Radiology)

更重要的是,深度学习模型对不同族裔女性的预测准确率相同,而包括Tyrer-Cuzick 模型在内的很多现有模型大多依照白人女性数据建立,对非白人族裔的预测效果较差,可能有超过10%的差距。在深度学习的帮助下,这一误差或将不复存在。

混合模型还发现了一些与现有认知矛盾的现象,比如业界主流声音认为,乳房密度与乳腺癌风险相关,致密型乳房患癌风险较高(原因未知)。

但该模型预测结果显示,存在有致密型乳房的低风险人群,也有低密度乳房的高风险人群,两者患病率相差较大,因此仅凭乳房密度判断患癌风险有失偏颇,可能会影响医疗决策。

图 | 致密型乳房 + 低风险人群患癌率1.4%(左下)VS 低密度乳房 + 高风险人群发病率4.0%(右上)(来源:论文)

仔细分析和比对结果后,研究人员认为这一模型拥有巨大潜力。经过改进的版本有望替代现有的传统乳腺癌风险预测模型,甚至是推动乳腺癌筛查策略的进步,制定更科学的医疗建议。

下一步,他们将着重突破现有研究的局限性,比如收集更全面的患者信息,并且与更多医疗机构合作,拓展 X 光图像的来源,获得不同设备拍摄的 X 光图像,从而更好地改进预测模型的准确率。他们希望有朝一日,可以将其大规模拓展,用来预测心脑血管或胰腺癌等其它疑难疾病。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MIT
    MIT
    +关注

    关注

    3

    文章

    254

    浏览量

    24585
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123088

原文标题:MIT用深度学习预测乳腺癌患病概率,五年内准确率几乎翻倍!

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了一个以三相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练网络
    发表于 06-25 13:06

    使用BP神经网络进行时间序列预测

    使用BP(Backpropagation)神经网络进行时间序列预测是一种常见且有效的方法。以下是一个基于BP神经网络进行时间序列预测的详细步
    的头像 发表于 02-12 16:44 ?897次阅读

    BP神经网络与卷积神经网络的比较

    多层。 每一层都由若干个神经元构成,神经元之间通过权重连接。信号在神经网络中是前向传播的,而误差是反向传播的。 卷积神经网络(CNN) :
    的头像 发表于 02-12 15:53 ?825次阅读

    BP神经网络的优缺点分析

    自学习能力 : BP神经网络能够通过训练数据自动调整网络参数,实现对输入数据的分类、回归等任务,无需人工进行复杂的特征工程。 泛化能力强 : BP
    的头像 发表于 02-12 15:36 ?1052次阅读

    什么是BP神经网络的反向传播算法

    神经网络(即反向传播神经网络)的核心,它建立在梯度下降法的基础上,是一种适合于多层神经元网络的学习算法。该算法通过计算每层网络的误差,并将这
    的头像 发表于 02-12 15:18 ?898次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工
    的头像 发表于 01-09 10:24 ?1400次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构<b class='flag-5'>方法</b>

    卷积神经网络传统神经网络的比较

    在深度学习领域,神经网络模型被广泛应用于各种任务,如图像识别、自然语言处理和游戏智能等。其中,卷积神经网络(CNNs)和传统神经网络是两种常见的模型。 1. 结构差异 1.1
    的头像 发表于 11-15 14:53 ?2041次阅读

    如何使用RNN进行时间序列预测

    时间序列预测在金融、气象、销售预测等领域有着广泛的应用。传统的时间序列分析方法,如ARIMA和指数平滑,虽然在某些情况下表现良好,但在处理非线性和复杂模式时可能不够灵活。递归
    的头像 发表于 11-15 09:45 ?1028次阅读

    RNN模型与传统神经网络的区别

    传统神经网络(前馈神经网络) 2.1 结构 传统神经网络,通常指的是前馈神经网络(Feedfo
    的头像 发表于 11-15 09:42 ?1272次阅读

    基于LSTM神经网络的情感分析方法

    能力而受到广泛关注。 1. 引言 情感分析在商业智能、客户服务、社交媒体监控等领域具有广泛的应用。传统的情感分析方法依赖于手工特征提取和机器学习算法,但这些方法往往难以处理文本中的长距
    的头像 发表于 11-13 10:15 ?1375次阅读

    LSTM神经网络的训练数据准备方法

    LSTM(Long Short-Term Memory,长短期记忆)神经网络的训练数据准备方法是一个关键步骤,它直接影响到模型的性能和效果。以下是一些关于LSTM神经网络训练数据准备的建议和
    的头像 发表于 11-13 10:08 ?2288次阅读

    LSTM神经网络传统RNN的区别

    在深度学习领域,循环神经网络(RNN)因其能够处理序列数据而受到广泛关注。然而,传统RNN在处理长序列时存在梯度消失或梯度爆炸的问题。为了解决这一问题,LSTM(长短期记忆)神经网络应运而生。 循环
    的头像 发表于 11-13 09:58 ?1334次阅读

    LSTM神经网络的优缺点分析

    长短期记忆(Long Short-Term Memory, LSTM)神经网络是一种特殊的循环神经网络(RNN),由Hochreiter和Schmidhuber在1997年提出。LSTM因其在处理
    的头像 发表于 11-13 09:57 ?5040次阅读

    LSTM神经网络在时间序列预测中的应用

    LSTM是一种特殊的循环神经网络(RNN),它能够学习长期依赖关系。与传统的RNN相比,LSTM通过引入门控机制(输入门、遗忘门、输出门)来解决梯度消失和梯度爆炸的问题,使其能够处理更长的序列数据。 LSTM的工作原理 LST
    的头像 发表于 11-13 09:54 ?2204次阅读

    关于卷积神经网络,这些概念你厘清了么~

    必须通过决策阈值做出决定。 另一个区别是AI并不依赖固定的规则,而是要经过训练。训练过程需要将大量猫的图像展示给神经网络以供其学习。最终,神经网络将能够独立识别图像中是否有猫。关键的一
    发表于 10-24 13:56