0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据的主要特征有哪些

汽车玩家 ? 来源:个人图书馆、百度服务商 ? 作者:个人图书馆、百度 ? 2022-02-07 10:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

在莱尼的理论基础上,IBM提出大数据的4V特征得到了业界的广泛认可:第一,数量,即数据巨大,从TB级别跃升到PB级别;第二,多样性,即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,速度,即处理速度快;第四,真实性,即追求高质量的数据。

数据体量巨大

容量大是大数据的首要特征,随着网络的发展,迫切的需要足够大的容量去统计分析以及预测大规模的数据。最开始的mp3时代仅仅只是mb级的存储,但是已经能满足很多人的要求了。随着信息技术的高度发展,存储单位也慢慢的发生了演变。从大家耳熟能详的***存储到了tb存储,乃至现在有了pb,eb等存储。

数据速度快

大数据的数据产生、处理和分析的速度在持续加快。加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。业界对大数据的处理能力有一个称谓——“1秒定律”,也就是说,可以从各种类型的数据中快速获得高价值的信息。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别。

数据类型繁多

大数据的数据类型繁多,传统IT产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。

现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如XML、邮件、博客、即时消息、视频、照片、点击流、日志文件等。企业需要整合、存储和分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。因为大数据的来源非常广泛,所以多样性成为了大数据的另一大特点。在任何形式下,所获取的来源都是可以使用的,目前为止应用比较广泛的有淘宝,网易云,头条等等。这些平台通过对用户的数据进行分析,从而对应的推荐一些用户比较喜欢的东西。

真实性

数据的重要性就在于对决策的支持,数据的规模并不能决定其能否为决策提供帮助,数据的真实性和质量才是获得真知和思路最重要的因素,是制定成功决策最坚实的基础。追求高数据质量是一项重要的大数据要求和挑战,即使最优秀的数据清理方法也无法消除某些数据固有的不可预测性。

在处理这些类型的数据时,数据清理无法修正这种不确定性,然而,尽管存在不确定性,数据仍然包含宝贵的信息。我们必须承认、接受大数据的不确定性,并确定如何充分利用这一点。

文章整合自:个人图书馆、百度服务商点亮工场、蚂蚜网

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 格式化
    +关注

    关注

    2

    文章

    39

    浏览量

    9371
  • 智能设备
    +关注

    关注

    5

    文章

    1102

    浏览量

    52292
  • 大数据
    +关注

    关注

    64

    文章

    8963

    浏览量

    140600
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?

    ; BLE (GATT) 应用程序 在此环境中,数据从客户端发送到 W \" rite,但没有响应 \" ez-Serial 的 “未确认数据特征” (UUID
    发表于 07-07 07:33

    PD快充芯片U8766的主要特征

    芯片工作频率指芯片内部时钟信号的振荡速率,是芯片性能的重要基础。晶体管导通电阻越小、切换速度越快,信号传输效率越高。PD快充芯片U8766的工作频率最高可达220kHz,可全范围工作在准谐振模式。芯片集成峰值电流抖动功能和驱动电流配置功能,可极大的优化系统EMI性能。U8766内置Boost供电电路,非常适用于宽输出电压的应用场景。
    的头像 发表于 06-18 16:47 ?521次阅读

    智慧环保大数据管理平台什么功能

    在环境污染问题日益严峻的当下,智慧环保大数据管理平台成为环境治理的重要利器。它围绕污水处理、垃圾处理、气体监测三大核心场景,深度融合大数据、物联网、人工智能等技术,构建起全方位、智能化的环境管理
    的头像 发表于 06-06 15:17 ?229次阅读
    智慧环保<b class='flag-5'>大数据</b>管理平台<b class='flag-5'>有</b>什么功能

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服务能力。两者结合,共同赋能企业决策、业务创新和效率提升。下面UU云小编将详细剖析
    的头像 发表于 02-20 14:48 ?722次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算技术类证书、
    的头像 发表于 02-19 11:05 ?716次阅读

    同步整流芯片U7612的主要特征

    同步整流芯片与主控配合,使整流元件与主开关管同步工作,避免了二极管反向恢复时间产生的电流谐波,能有效减少电磁干扰,使产品更易通过电磁兼容性测试。同步整流芯片U7612是一款带快速关断功能的高性能副边同步整流功率开关,可以替代肖特基整流二极管以提高系统效率。
    的头像 发表于 02-17 16:13 ?633次阅读

    电源管理IC U6018的主要特征

    DIP-8 封装的电源管理ic引脚布局相对简单,信号传输路径较为直接,有利于减少信号传输过程中的干扰和延迟,适合于一些对电气性能要求不是特别苛刻的低频、低功率电路应用。电源管理ic U6018采用DIP-8封装,内置通用初级侧CC控制,简化了隔离电源设计,是一款高性能电流模式PWM电源开关,适用于离线反激式转换器应用。
    的头像 发表于 02-12 15:57 ?652次阅读

    开关柜机械特征监控主要参数哪些?如何实现?

    蜀瑞创新为大家科普:开关柜机械特征监控是指对电力系统中使用的开关设备的机械性能进行监测,以确保其正常运行并预防故障。开关柜机械特征监控是确保电力系统安全稳定运行的重要环节。其实现方式主要依赖于多种技术手段的综合运用。
    的头像 发表于 12-21 16:35 ?547次阅读
    开关柜机械<b class='flag-5'>特征</b>监控<b class='flag-5'>主要</b>参数哪些?如何实现?

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,
    的头像 发表于 12-18 09:45 ?819次阅读

    AMC1303E输出接的Altera FPGA,通过FPGA解码后输出总是突然来个变异的大数据,为什么?

    AMC1303E输出接的Altera FPGA,解码输出后数据流总是问题: 正常数据下,通过FPGA解码后输出总是突然来个变异的大数据,无规律,间隔几秒钟。单独给AMC1303原边
    发表于 12-03 07:08

    ADS1675最大数据吞吐率是是多少?

    ADS1675 24bit的ADC的采样率最大是4Msps,请问这款adc的最大数据吞吐率是是多少?怎么算的,在datasheet中有明确写出来吗
    发表于 11-28 07:56

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析中
    的头像 发表于 11-12 09:44 ?779次阅读

    智慧城市与大数据的关系

    智慧城市与大数据之间存在着密切的关系,这种关系体现在大数据对智慧城市建设的支撑和推动作用,以及智慧城市产生的大量数据大数据技术的应用需求。 大数据
    的头像 发表于 10-24 15:27 ?1372次阅读

    dct变换的主要优点哪些

    中的少数几个系数中,从而实现高效的压缩。以下是DCT变换的一些主要优点: 能量压缩 :DCT的一个显著优点是它能够将图像的能量集中在变换后的低频系数中。这意味着图像中最重要的信息(通常是图像的主要特征)被保留在少数几个系数中,
    的头像 发表于 09-30 16:30 ?1339次阅读

    电气设备或电气线路故障引起的火灾主要特征

    1 主要特征 ? 电气火灾是由电气设备或电气线路故障引起的火灾。这类火灾具有一定的特殊性,主要特征如下: 1)突发性强 突发性:电气火灾往往在没有明显征兆的情况下突然发生,不易被及时察觉。 瞬间爆发
    的头像 发表于 09-12 18:00 ?1420次阅读
    电气设备或电气线路故障引起的火灾<b class='flag-5'>主要特征</b>