0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据怎么玩?数据存储这个关键技术要学好

电子设计 ? 2017-11-27 14:34 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大数据存储与管理要用存储器把采集到的数据存储起来,建立相应的数据库,以便管理和调用。由于从多渠道获得的原始数据常常缺乏一致性,这导致标准处理和存储技术失去可行性。并且数据不断增长造成单机系统的性能不断下降,即使不断提升硬件配置也难以跟上数据增长的速度。

大数据存储和管理发展过程中出现了如下几类大数据存储和管理数据库系统:分布式文件存储、NoSQL数据库、NewSQL数据库。

一、分布式文件存储

分布式文件存储的特点之一是为了解决复杂问题而将大任务分解为多项小任务,通过让多个处理器或多个计算机节点并行计算来提高解决问题的效率。

分布式文件系统能够支持多台主机通过网络同时访问共享文件和存储目录,大部分采用了关系数据模型并且支持SQL语句查询。为了能够并行执行SQL的查询操作,系统中采用了两个关键技术:关系表的水平划分和SQL查询的分区执行。

水平划分的主要思想是根据某种策略将关系表中的元组分布到集群中的不同节点上,由于这些节点上的表结构是一致的,因此便可以对元组并行处理。在分区存储关系表中处理SQL查询需要使用基于分区的执行策略。

分布式文件系统可通过多个节点并行执行数据库任务,提高整个数据库系统的性能和可用性。其主要缺点为缺乏较好的弹性,并且容错性较差。

二、NoSQL数据库

传统关系型数据库在数据密集型应用方面显得力不从心,主要表现在灵活性差、扩展性差、性能差等方面。而NoSQL摒弃了传统关系型数据库管理系统的设计思想,采用了不同的解决方案来满足扩展性方面的需求。由于它没有固定的数据模式并且可以水平扩展,因而能够很好地应对海量数据的挑战。相对于关系型数据库而言,NoSQL最大的不同是不使用SQL作为查询语言。NoSQL数据库主要优势有:避免不必要的复杂性、高吞吐量、高水平扩展能力和低端硬件集群、避免了昂贵的对象-关系映射。

三、NewSQL数据库

NewSQL数据库采用了不同的设计,它取消了耗费资源的缓冲池,摒弃了单线程服务的锁机制,通过使用冗余机器来实现复制和故障恢复,取代原有的昂贵的恢复操作。这种可扩展、高性能的SQL数据库被称为NewSQL,其中“New”用来表明与传统关系型数据库系统的区别。NewSQL主要包括两类系统:1. 拥有关系型数据库产品和服务,并将关系模型的好处带到分布式架构上;2. 提高关系数据库的性能,使之达到不用考虑水平扩展问题的程度。

NewSQL能够提供SQL数据库的质量保证,也能提供NoSQL数据库的可扩展性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据存储
    +关注

    关注

    5

    文章

    1003

    浏览量

    51828
  • 数据库系统
    +关注

    关注

    0

    文章

    31

    浏览量

    9889
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    P2P技术——数据采集系统高效存储关键

    P2P技术凭借其直连高效、低延迟的特点,已成为数据采集系统实现高效数据存储关键技术。作为专业的数据
    的头像 发表于 07-24 17:24 ?264次阅读
    P2P<b class='flag-5'>技术</b>——<b class='flag-5'>数据</b>采集系统高效<b class='flag-5'>存储</b>的<b class='flag-5'>关键</b>

    无人值守光伏电站管理系统实现的关键技术

    、智能诊断和自动控制,从而减少人工干预、提升运营效率。 光伏电实现无人值守,需要采取多种关键技术,如物联网与传感器技术、人工智能与大数据、自动化控制与执行、安全与可靠性设计等。物联网
    的头像 发表于 07-11 11:00 ?452次阅读
    无人值守光伏电站管理系统实现的<b class='flag-5'>关键技术</b>

    电机系统节能关键技术及展望

    节约能源既是我国经济和社会发展的一项长远战略和基本国策,也是当前的紧迫任务。论文在深入分析国内外电机系统节能现状和介绍先进的节能关键技术的基础上,指出了现阶段我国在电机系统节能方面存在的问题,并结合
    发表于 04-30 00:43

    浅谈华为通信大模型的关键技术

    推理、幻觉纠正及多维联合决策等方面创新成果的肯定。为此,我们将分三期深入解读华为通信大模型无线的关键技术和价值应用,本期聚焦于通信大模型的部署、训练和推理的关键技术
    的头像 发表于 03-26 14:35 ?714次阅读

    智能交通的关键技术支撑

    智能交通系统的发展离不开一系列关键技术的支撑。这些技术不仅推动了交通系统的智能化升级,更重要的是为未来交通模式的创新提供了可能。从数据采集到智能决策,从车路协同到自动驾驶,每一项技术
    的头像 发表于 03-17 15:38 ?403次阅读

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、
    的头像 发表于 02-20 14:48 ?775次阅读

    云计算HPC软件关键技术

    云计算HPC软件关键技术涉及系统架构、处理器技术、操作系统、计算加速、网络技术以及软件优化等多个方面。下面,AI部落小编带您探讨云计算HPC软件的关键技术
    的头像 发表于 12-18 11:23 ?526次阅读

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式
    的头像 发表于 12-18 09:45 ?875次阅读

    制造企业数字化转型的关键技术探秘

    制造企业数字化转型面临挑战,大数据分析和云计算技术技术为企业带来优势。大数据分析可优化生产过程、降低成本、提高效率;云计算技术可实现
    的头像 发表于 12-03 10:48 ?664次阅读
    制造企业数字化转型的<b class='flag-5'>关键技术</b>探秘

    哪些关键技术助力智慧园区建设

    在如今数字化转型的浪潮中,智慧园区已经成为城市发展的重要组成部分。建设智慧园区需要借助一系列关键技术来实现其智能化、高效化和可持续发展。其中,物联网技术被认为是连接各类设备、传感器和系统的核心技术
    的头像 发表于 11-29 13:58 ?415次阅读

    raid 在大数据分析中的应用

    的具体应用: 一、提高性能 并行读写 :RAID技术通过并行读写多个磁盘,可以显著提高数据的读写速度。在大数据分析环境中,数据读写速度是影响分析效率的
    的头像 发表于 11-12 09:44 ?829次阅读

    emc技术大数据分析中的角色

    在当今这个数据驱动的世界中,大数据分析已经成为企业获取洞察力、优化业务流程和提高竞争力的关键工具。随着数据量的爆炸性增长,企业面临着如何有效存储
    的头像 发表于 11-01 15:22 ?786次阅读

    实现智慧城市的关键技术

    实现智慧城市的关键技术主要包括物联网技术大数据技术、人工智能技术、云计算技术、5G通信
    的头像 发表于 10-24 16:12 ?1998次阅读

    智慧城市与大数据的关系

    的建设需要对海量的数据资源进行收集、整合、存储与分析。大数据技术的应用,如智能感知、分布式存储等,使得这些
    的头像 发表于 10-24 15:27 ?1434次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量
    的头像 发表于 10-24 09:18 ?1217次阅读