从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。
在莱尼的理论基础上,IBM提出大数据的4V特征得到了业界的广泛认可:第一,数量,即数据巨大,从TB级别跃升到PB级别;第二,多样性,即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,速度,即处理速度快;第四,真实性,即追求高质量的数据。
数据体量巨大
容量大是大数据的首要特征,随着网络的发展,迫切的需要足够大的容量去统计分析以及预测大规模的数据。最开始的mp3时代仅仅只是mb级的存储,但是已经能满足很多人的要求了。随着信息技术的高度发展,存储单位也慢慢的发生了演变。从大家耳熟能详的***存储到了tb存储,乃至现在有了pb,eb等存储。
数据速度快
大数据的数据产生、处理和分析的速度在持续加快。加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。业界对大数据的处理能力有一个称谓——“1秒定律”,也就是说,可以从各种类型的数据中快速获得高价值的信息。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别。
数据类型繁多
大数据的数据类型繁多,传统IT产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。
现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如XML、邮件、博客、即时消息、视频、照片、点击流、日志文件等。企业需要整合、存储和分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。因为大数据的来源非常广泛,所以多样性成为了大数据的另一大特点。在任何形式下,所获取的来源都是可以使用的,目前为止应用比较广泛的有淘宝,网易云,头条等等。这些平台通过对用户的数据进行分析,从而对应的推荐一些用户比较喜欢的东西。
真实性
数据的重要性就在于对决策的支持,数据的规模并不能决定其能否为决策提供帮助,数据的真实性和质量才是获得真知和思路最重要的因素,是制定成功决策最坚实的基础。追求高数据质量是一项重要的大数据要求和挑战,即使最优秀的数据清理方法也无法消除某些数据固有的不可预测性。
在处理这些类型的数据时,数据清理无法修正这种不确定性,然而,尽管存在不确定性,数据仍然包含宝贵的信息。我们必须承认、接受大数据的不确定性,并确定如何充分利用这一点。
文章整合自:个人图书馆、百度服务商点亮工场、蚂蚜网
审核编辑:鄢孟繁
-
格式化
+关注
关注
2文章
39浏览量
9371 -
智能设备
+关注
关注
5文章
1102浏览量
52292 -
大数据
+关注
关注
64文章
8963浏览量
140600
发布评论请先 登录
在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?
PD快充芯片U8766的主要特征
智慧环保大数据管理平台有什么功能

大数据与云计算是干嘛的?
大数据云计算都需要考什么证书?
同步整流芯片U7612的主要特征
电源管理IC U6018的主要特征
开关柜机械特征监控主要参数哪些?如何实现?

缓存对大数据处理的影响分析
AMC1303E输出接的Altera FPGA,通过FPGA解码后输出总是突然来个变异的大数据,为什么?
ADS1675最大数据吞吐率是是多少?
raid 在大数据分析中的应用
智慧城市与大数据的关系
dct变换的主要优点有哪些
电气设备或电气线路故障引起的火灾主要特征

评论