0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据分析技术架构的通用模块

h1654155282.3538 ? 来源:加米谷大数据张衡 ? 作者:加米谷大数据张衡 ? 2020-10-29 15:13 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于企业而言,坐拥庞大的数据资源,想要实现大数据分析,首要的就是要搭建起自身的大数据系统平台,而每个公司都有自己特定的业务场景,因此在大数据平台上的需求是不一样的。今天我们仅从通用的角度,来聊聊大数据分析需要什么技术架构?

我们熟悉的以BAT为首的互联网大厂,都拥有自身的大数据系统平台,但是各自面临的业务场景是不同的,比如说腾讯,主要是社交业务场景;百度,主要是搜索业务场景;而阿里,主要是电商业务场景。

这样不同的业务场景下,需要根据实际的业务需求,选择适合自己的技术框架,来搭建自己的大数据架构体系。但是从技术架构体系的共性来说,是可以从通用的技术模块去理解,来帮助我们更好地学习和掌握大数据技术架构的。

数据收集模块:主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。

数据转存模块:主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。

ETL模块:主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。

数据仓库模块:这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。

元数据管理模块:主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。

分析引擎模块:数据分析师交互最多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。

作业管理与调度模块:负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。

资源分配与调度模块:主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率最大化。
责任编辑人:CC

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    8963

    浏览量

    140583
  • 大数据分析
    +关注

    关注

    1

    文章

    135

    浏览量

    17522
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 ?151次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    环网柜局放大数据分析方案:电力运维的“智慧大脑”

    放电现象。这种放电虽初期难以察觉,却会持续侵蚀绝缘性能,最终导致短路、停电等重大事故。传统的定期巡检模式难以捕捉早期微弱放电,而环网柜局放大数据分析方案的出现,为
    的头像 发表于 05-07 10:07 ?206次阅读
    环网柜局放<b class='flag-5'>大数据分析</b>方案:电力运维的“智慧大脑”

    电力系统数据分析技术

    随着智能电网技术的发展和大数据时代的到来,电力系统数据分析技术已成为电力行业不可或缺的一部分。这些技术能够帮助电力公司更好地理解电网的运行状
    的头像 发表于 01-18 09:46 ?780次阅读

    智能焊接数据分析设备提升工业效率与精度

    随着科技的不断进步,智能制造已经成为推动工业4.0发展的关键力量。在众多的智能制造技术中,智能焊接数据分析设备因其在提高生产效率和焊接质量方面的显著效果而受到广泛关注。本文将探讨智能焊接数据分析设备
    的头像 发表于 01-15 14:11 ?467次阅读

    Mathematica 在数据分析中的应用

    数据分析是现代科学研究和商业决策中不可或缺的一部分。随着数据量的爆炸性增长,对数据分析工具的需求也在不断增加。Mathematica,作为一种强大的计算软件,以其独特的符号计算能力和广泛的内置函数库
    的头像 发表于 12-26 15:41 ?762次阅读

    数据可视化与数据分析的关系

    在当今这个信息爆炸的时代,数据无处不在。无论是企业运营、科学研究还是个人决策,我们都需要从海量的数据中提取有价值的信息。数据分析数据可视化作为两个关键的工具,它们帮助我们理解、解释和
    的头像 发表于 12-06 17:09 ?1012次阅读

    bds 行业发展趋势分析 bds在大数据中的应用

    BDS(大数据分析技术)作为一种通过收集、处理和分析大量数据以提取有价值信息和洞察力的技术,在当前数字化时代发挥着至关重要的作用。 一、BD
    的头像 发表于 11-22 15:47 ?1577次阅读

    LLM在数据分析中的作用

    随着大数据时代的到来,数据分析已经成为企业和组织决策的关键工具。数据科学家和分析师需要从海量数据中提取有价值的信息,以支持业务决策。在这个过
    的头像 发表于 11-19 15:35 ?1213次阅读

    eda与传统数据分析的区别

    EDA(Exploratory Data Analysis,探索性数据分析)与传统数据分析之间存在显著的差异。以下是两者的主要区别: 一、分析目的和方法论 EDA 目的 :EDA的主要目的是对
    的头像 发表于 11-13 10:52 ?937次阅读

    为什么选择eda进行数据分析

    数据科学领域,数据分析是一个复杂且多步骤的过程,它涉及到数据的收集、清洗、探索、建模和解释。在这些步骤中,探索性数据分析(EDA)扮演着至关重要的角色。 1. 理解
    的头像 发表于 11-13 10:41 ?797次阅读

    raid 在大数据分析中的应用

    的具体应用: 一、提高性能 并行读写 :RAID技术通过并行读写多个磁盘,可以显著提高数据的读写速度。在大数据分析环境中,数据读写速度是影响分析
    的头像 发表于 11-12 09:44 ?773次阅读

    emc技术大数据分析中的角色

    大数据分析通常涉及来自多个来源和格式的数据。这些数据可能包括结构化数据(如数据库中的表格数据
    的头像 发表于 11-01 15:22 ?720次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量数据 云计算提供了强大的存储和计算能力
    的头像 发表于 10-24 09:18 ?1169次阅读

    使用AI大模型进行数据分析的技巧

    使用AI大模型进行数据分析的技巧涉及多个方面,以下是一些关键的步骤和注意事项: 一、明确任务目标和需求 在使用AI大模型之前,首先要明确数据分析的任务目标,这将直接影响模型的选择、数据收集和处理方式
    的头像 发表于 10-23 15:14 ?2868次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析 大数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量数据
    的头像 发表于 10-09 15:32 ?608次阅读
    IP 地址<b class='flag-5'>大数据分析</b>如何进行网络优化?