0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息携手北京英信 基于分布式存储 助力求臻医学解锁生命密码

全球TMT ? 来源: 全球TMT ? 作者: 全球TMT ? 2023-04-21 17:27 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2023年4月21日 /美通社/ -- "一花一世界",这句话在蛋白质、DNA所在的微观世界里体现得淋漓尽致,大到动植物、小到细菌,都蕴含着独特的DNA,例如人体内就包含着23对染色体、30亿个碱基对的数据量。探索这些碱基对蕴藏的"生命密码",对于肿瘤早筛、罕见病诊治、靶向药物研制、遗传演化和精准医学研究等方面有重大助益。近期,北京英信未来科技有限公司(以下简称北京英信)联合浪潮信息,为求臻医学的高通量测序平台提供了分布式存储平台,为全国数百家医院的肿瘤患者提供了精准、高效的肿瘤基因检测服务。

肿瘤基因检测 为何要跑在大数据上

基因检测作为医疗领域的新应用,不仅需要基于大数据平台,利用极为精密的测序系统将基因序列解读出来,还要通过大数据分析、比对,精确地了解每个基因片段发挥的作用。在这方面,求臻医学拥有专业、丰富的经验。

求臻医学成立于2017年,以新一代基因测序和先进信息挖掘技术为基础,依托《中国肿瘤基因图谱计划》和《肿瘤精准医学大数据平台》项目,深度融合基因检测和人工智能,致力于肿瘤液态活检领域诊断产品的开发及智能迭代升级,业务涵盖肿瘤早筛、伴随诊断、动态监测、预后评估等多场景应用领域,同时不断探索发现中国人肿瘤基线及特异的生物标志物,助力抗肿瘤药物的研发。

然而,随着业务高速发展,求臻医学服务的医院、患者越来越多,数据量也相应的急速增长,原有的数据存储系统常常因巨量访问而超过性能阈值,存储系统也存在容量空间严重不足的情况。在这种情况下,求臻医学计划对原有的数据存储平台进行升级,新建的数据存储平台将主要支持肿瘤精准诊疗的生物医学信息化平台。

此平台涵盖了知识数据库、临床信息采集系统、数据注释接口(API)等模块系统,可以基于大数据分析为基因检测客户生成个体化的检测报告。整个信息平台数据存储的基础设施有着较大的挑战和要求:

首先,是存储数据量的需求。一个完整的基因测序样本会产生千万量级的文件。据了解,目前一台先进的测序仪、分析仪等设备每天捕捉的测序数据平均水平已达到4TB,加之基因信息分析过程一般会产生原始数据量5倍左右的中间文件及结果,PB级别存储空间已经成为存储设备的基本要求。

其次,是数据可靠性的需求。肿瘤基因检测数据作为肿瘤精准诊疗核心数据,检测数据通常需要长期保存多年,通过合理的生命周期管理系统进行归档保留,数据的自动化迁移归档、数据的安全性、存储的易扩展性是数据归档存储考虑的重要因素。

最后,基因测序访问实时性要求高。基因测序过程是一个超高并发的文件转换过程,整个生产过程有非常密集的文件读取和写入。整个生物样本的导入过程对文件存储的性能有着极高的要求,满足科研任务对不同文件高带宽的存储需求,既要文件系统必须提供超大文件数量的支持,同时必须在有限的时间内完成海量小文件的导入。

分布式存储:为基因测序构建数据基座

针对求臻医学基因测序应用数据量增长快、性能和可靠性要求高的业务特点,浪潮信息携手合作伙伴北京英信为求臻医学提供了专业化的存储解决方案。方案采用AS13000高密分布式存储,节点间管理网络采用千兆交换机,通过100GB高速IB网络连接前端并行计算业务集群,为前端业务构建了一套大容量、高可靠、高性能、低延迟的数据存储平台。

在容量方面,AS13000分布式存储集群由5个节点组成,每节点采用35块8T大容量硬盘配置,可提供PB级存储容量,满足海量数据存储需求。值得一提的是,该解决方案可实现分钟级扩充,最大可扩展至5120节点,在扩容同时可保障业务性能无明显波动,性能与容量随着节点的扩展而线性增长,避免对现有计算任务读写访问性能造成影响,使得存储系统的容量、性能在未来可随时按需扩展。

在可靠性方面,浪潮信息分布式存储平台AS13000提供副本和纠删码两种数据保护方式,为用户提供多层级的数据保护及容灾功能,充分保证检测任务以及前端计算任务7x24小时的连续读写访问。结合信息平台检测数据需要长期保存的业务特点,浪潮信息采用三副本的数据冗余保护方式,同时,还可搭配InView智能统一存储管理平台,对基因测序数据中心的设备进行管理,提供容量、性能、故障的智能化预测性分析,帮助运维人员预防硬件潜在故障,降低了存储的复杂性,同时也有效地降低了运维成本。

在性能方面,浪潮信息分布式存储解决方案针对基因测序数据特点采用冷热数据分级存储搭配全局缓存技术,实现热数据快速响应,延迟降低40%。对于对象类型数据,采用对象聚合技术,来提升单次落盘的对象大小,降低落盘操作次数,单节点恒定聚合带宽达2GB/s以上,确保基因测序任务的读写性能。

目前,基因测序应用范围在大幅扩展,从科研服务的基因图谱、遗传多样性,到医疗服务的疾病早筛和治疗都能涵盖,这对未来提升医疗智慧水平意义重大。浪潮信息始终坚持通过数据的力量,为基因测序基础研究储能,驱动精准医疗应用加速发展。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4557

    浏览量

    87724
  • 分布式
    +关注

    关注

    1

    文章

    1009

    浏览量

    75620
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    飞利浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息北京飞利电子技术有限公司等22家战略合作伙伴达成签约,其中将面向
    的头像 发表于 06-24 17:37 ?663次阅读

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 ?592次阅读

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据数据模型可分为键值
    的头像 发表于 02-20 11:00 ?702次阅读

    浪潮信息存储SATA SSD:技术创新引领数据存储新时代

    在智慧时代,数据存储需求日益增长,对存储产品的性能和稳定性提出了更高要求。浪潮信息存储,作为行业内的佼佼者,积极响应市场需求,通过自主研发,不断积累技术优势,致力于为用户提供高性能、高
    的头像 发表于 02-07 13:41 ?728次阅读

    浪潮信息存储SATA SSD:以技术创新,开启数据存储新篇章

    计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储解决方案。 浪潮信息存储积极响应市场需求,通过自主研发不断积累技术优势,推出了SATA、NVMe、双端口、ZNS等全系列存储
    的头像 发表于 01-24 10:02 ?511次阅读

    浪潮信息与智源研究院携手共建大模型多元算力生态

    近日,浪潮信息北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 ?674次阅读

    浪潮信息剖析智能时代数据存储领域面临的挑战与机遇

    在当今数字化时代,算力与存力的协同增长已成为驱动各行各业发展的关键力量。特别是在人工智能(AI)这一前沿领域,随着数据量的爆炸增长,对存储系统的需求日益复杂和多样。近期,在首届CCF中国存储大会上,
    的头像 发表于 12-30 09:43 ?846次阅读

    浪潮信息与智源研究院达成战略合作协议

    正式接入浪潮信息的元脑企智EPAI企业大模型开发平台,助力企业实现更快速、更广泛、更高效的多元算力适配与使用。
    的头像 发表于 12-26 10:25 ?666次阅读

    浪潮信息与17家元脑伙伴共签亿级分销协议

    近日,一场意义非凡的签约仪式——2025年浪潮信息亿级分销伙伴签约大会圆满落幕。在这场盛会中,浪潮信息与来自全国12个省区的17家元脑生态伙伴共同签署了亿级分销合作协议,携手开启合作共赢的新篇章
    的头像 发表于 12-25 15:46 ?818次阅读

    WDS分布式存储系统软件助力电信工程海量数据存储项目

    WDS分布式存储系统软件助力电信工程海量数据存储项目
    的头像 发表于 11-11 09:59 ?561次阅读
    WDS<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统软件<b class='flag-5'>助力</b>电信工程海量数据<b class='flag-5'>存储</b>项目

    浪潮信息AI存储性能测试的领先之道

    AI技术的无限可能。近日,在MLCommons的子项目MLPerf Storage v1.0性能基准评测中,浪潮信息再度展现了在AI存储领域的卓越实力。
    的头像 发表于 10-29 16:30 ?743次阅读
    <b class='flag-5'>浪潮信息</b>AI<b class='flag-5'>存储</b>性能测试的领先之道

    浪潮信息AS13000G7荣获MLPerf? AI存储基准测试五项性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons协会发布最新MLPerf? Storage v1.0 AI存储基准测试成绩。浪潮信息分布式
    的头像 发表于 09-28 16:46 ?466次阅读
    <b class='flag-5'>浪潮信息</b>AS13000G7荣获MLPerf? AI<b class='flag-5'>存储</b>基准测试五项性能全球第一

    分布式存储费用高吗?大概需要多少钱

    分布式存储的费用是否高,取决于多个因素,包括存储容量、性能要求、服务提供商、计费模式等。因此,无法简单地给出一个“高”或“不高”的答案。通常分布式
    的头像 发表于 09-24 10:41 ?645次阅读

    浪潮信息:元脑企智EPAI助力金融大模型快速落地

    浪潮信息在AI算力底座建设、大模型开发领域积累的成熟、成功经验工具化,助力金融机构又快、又稳地部署生成AI应用,助力金融数智化跨越发展
    的头像 发表于 09-20 16:07 ?760次阅读
    <b class='flag-5'>浪潮信息</b>:元脑企智EPAI<b class='flag-5'>助力</b>金融大模型快速落地

    基于分布式存储WDS的金融创云承载数据库类关键应用

    基于分布式存储WDS的金融创云承载数据库类关键应用
    的头像 发表于 08-16 09:42 ?636次阅读
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>WDS的金融<b class='flag-5'>信</b>创云承载数据库类关键应用