0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是流处理?为何选择流处理?

丽台科技 ? 来源:丽台科技 ? 2023-12-05 09:22 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1?

什么是流处理?

流是从生产者到消费者的一系列无限事件。大量数据生成为金融交易、传感器测量或 Web 服务器日志等事件流。流处理是对接收到的新数据事件的连续处理。

Streamz 等流处理库有助于构建用于管理连续数据流的流程,允许应用程序在事件发生时对其作出响应。

9c4a74f8-9305-11ee-939d-92fbcf53809c.png

流处理流程通常涉及多个操作,例如过滤、聚合、计数、分析、转换、充实、分支、连接、流量控制、早期阶段反馈、回压和存储。

2?

为何选择流处理?

数据流的持续处理在许多应用程序中都非常有帮助,例如:

医疗健康:持续监控仪器数据

智慧城市:交通模式和拥塞管理

制造:优化和预测性维护

运输:优化路线和燃料消耗

汽车:智能汽车

网络安全和异常检测:Web 或网络日志处理

金融:股票上市时间序列

机器学习:实时预测

广告:基于位置或动作的广告

由于各企业高度依赖实时分析、推理、监控等功能,因此流处理市场正经历指数级发展。现在,基于流构建的服务是日常业务的核心组成部分,结构化遥测事件和非结构化日志正以每年超过 5 倍的速度增长。在现代商业环境中,这种规模的大数据流愈加复杂并且难以有效地运行,因此,经济高效的可靠流对其至关重要。

3?

GPU 加速流处理

NVIDIA RAPIDScuStreamz 是 GPU 加速流数据处理库,旨在加速流处理吞吐量并降低总拥有成本 (TCO)。NVIDIA 的 cuStreamz 制作流程每年可节省数十万美元。cuStreamz 使用 Python 编写,基于 RAPIDS(用于数据科学库的 GPU 加速器)而构建。通过添加 GPU 支持的 Flink 可以看出,端到端 GPU 加速正迅速成为行业标准,NVIDIA 很高兴能成为此趋势的一个组成部分。

cuStreamz 基于以下内容构建:

Streamz,一个能够帮助构建管理连续数据流流程的开源 Python 库;

Dask,一个能够并行处理流工作负载的稳健可靠的调度程序;

RAPIDS,一种用于流计算的 GPU 加速库套件。

cuStreamz 通过在后台利用 RAPIDS cuDF 来加速 Streamz,从而使用 GPU 加速流数据计算。cuStreamz 还受益于 cuDF 的加速 JSON、Parquet 和 CSV 读取器和写入器。cuStreamz 团队构建了一个加速 Kafka 数据源连接器,能够非常快速地将 Kafka 的数据直接读取到 cuDF 数据帧中,从而显著提升端到端性能。然后,可以使用 Dask 在分布式模式下并行运行流流程,从而大规模提高性能。

9c62f5dc-9305-11ee-939d-92fbcf53809c.png

在下图中对 cuStreamz 架构进行了概括总结。cuStreamz 是连接 Python 流与 GPU 的桥梁,应用了检查点和状态管理等复杂可靠的流功能。cuStreamz 还提供了必要的基础模块来编写流作业,这些作业在 GPU 上安全运行,并且性能更好,成本更低。

9c7f509c-9305-11ee-939d-92fbcf53809c.png

4?

GPU 加速的端到端数据科学

基于 NVIDIA CUDA-X AI构建的 RAPIDS 开源软件库,使您完全能够在 GPU 上执行端到端数据科学和分析流程。此套件依靠 NVIDIA CUDA基元进行低级别计算优化,但通过用户友好型 Python 接口能够实现 GPU 并行化和高带宽显存速度。

9c8b6440-9305-11ee-939d-92fbcf53809c.png

借助 RAPIDS GPU DataFrame,数据可以通过一个类似 Pandas 的接口加载到 GPU 上,然后用于各种连接的机器学习和图形分析算法,而无需离开 GPU。这种级别的互操作性是通过 Apache Arrow 这样的库实现的。允许加速数据准备、机器学习和深度学习等端到端流程。

RAPIDS cuML 的机器学习算法和数学基元遵循熟悉的类似于 scikit-learn 的 API。单块 GPU 和大型数据中心部署均支持 XGBoost 等主流算法。针对大型数据集,相较于同等功效的 CPU,这些基于 GPU 的实施方案能够以 10 到 50 倍的速度更快地完成任务。

RAPIDS 支持在许多热门数据科学库之间共享设备内存。这样可将数据保留在 GPU 上,并省去了来回复制主机内存的高昂成本。

9c988a44-9305-11ee-939d-92fbcf53809c.png

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2570

    文章

    53374

    浏览量

    771006
  • 加速器
    +关注

    关注

    2

    文章

    830

    浏览量

    39325
  • 机器学习
    +关注

    关注

    66

    文章

    8518

    浏览量

    135170
  • 智能汽车
    +关注

    关注

    30

    文章

    3123

    浏览量

    108549
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6235

原文标题:丽台科普丨什么是流处理?

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是反时限过保护?深入解析反时限过保护的应用场景与优势

    在电力系统中,过保护是保障设备安全运行和电网稳定性的重要环节。其中,反时限过保护以其独特的动作特性,在特定应用场景下发挥着不可替代的作用。本文将深入探讨反时限过保护的原理、优势,并重点解析在哪
    的头像 发表于 07-17 13:53 ?592次阅读
    什么是反时限过<b class='flag-5'>流</b>保护?深入解析反时限过<b class='flag-5'>流</b>保护的应用场景与优势

    泰克设备在微控技术研究中的应用

    控(Microfluidics)是一种使用微管道(尺寸为数十到数百微米)处理或操控微小流体(体积为纳升到阿升)的系统所涉及的科学和技术。 它是一门涉及化学、流体物理、微电子、新材料、生物学
    的头像 发表于 05-22 16:26 ?437次阅读
    泰克设备在微<b class='flag-5'>流</b>控技术研究中的应用

    FCX3上的视频乱码怎么解决?

    我们在使用 CX3 和 1.3.5 EzUSB SDK 运行视频传感器时遇到了一些间歇性问题。 打开视频任意时间后,视频似乎已损坏,就像视频缓冲区已被交换一样,如附图中带有条形测试图案所示
    发表于 05-16 07:32

    FPGA EDA软件的位验证

    验证,对于芯片研发是一个非常重要的测试手段,对于纯软件开发人员,最难理解的就是位验证。在FPGA芯片研发中,位验证是在做什么,在哪些阶段需要做位验证,如何做?都是问题。
    的头像 发表于 04-25 09:42 ?1575次阅读
    FPGA EDA软件的位<b class='flag-5'>流</b>验证

    变频器过(oc)类故障原因分析及处理

    变频器过(OC)故障是工业控制中常见且影响严重的故障之一。当变频器检测到输出电流超过设定阈值时,会触发保护机制,导致变频器停机报警。以下是对变频器过(OC)类故障的原因分析及处理方法的详细阐述
    的头像 发表于 03-16 17:15 ?2019次阅读

    AI工作自动化是做什么的

    AI工作自动化是指利用人工智能技术,对工作流程中的重复性、规则明确的任务进行自动化处理的过程。那么,AI工作自动化是做什么的呢?接下来,AI部落小编为您分享。
    的头像 发表于 01-06 17:57 ?890次阅读

    控芯片键合技术

    控芯片键合技术的重要性 微控芯片的键合技术是实现其功能的关键步骤之一,特别是在密封技术方面。键合技术的选择直接影响到微控芯片的整体性能和可靠性。 不同材料的键合方式 玻璃材料:
    的头像 发表于 12-30 13:56 ?724次阅读

    ASCP200 过保护参数设置

    保护
    acrelxqx
    发布于 :2024年12月18日 09:26:52

    控技术的生物学应用

    取得了一定进展,但在样品引入和处理一定体积范围的流体方面仍然存在一些挑战。纳米技术的最新发展则有助于提升微控技术。微系统已经彻底改变了可用于分析复杂样品的高灵敏度生物分析系统的发展。这些器件可用于多种领域
    的头像 发表于 12-01 21:50 ?589次阅读

    数据科学工作原理

    数据科学工作包括数据收集、数据预处理、数据探索与可视化、特征选择与工程、模型选择与训练、模型评估与优化、结果解释与报告、部署与监控等环节。
    的头像 发表于 11-20 10:36 ?660次阅读

    控阵列芯片和普通芯片的区别

    控阵列芯片与普通芯片在设计与应用上存在显著差异 设计原理:微控阵列芯片以微米级通道操控流体,集成多种实验功能;普通芯片则通常基于晶体管,用于电子信号处理。 应用领域:微控阵列芯
    的头像 发表于 10-30 15:10 ?853次阅读

    二极管的工作原理和应用

    二极管,也称为恒晶体管,是一种具有恒定电流输出特性的半导体器件。它在电子电路中具有广泛的应用,如电源管理、信号处理、光电子学等领域。以下是对恒二极管及其工作原理的详细阐述。
    的头像 发表于 09-26 17:48 ?1802次阅读

    保护片的型号选择要考虑哪些参数

    保护片,也称为过电流保护片或电流限制片,是一种用于电路中保护电子设备免受过大电流损害的元件。选择合适的过保护片对于确保电路的可靠性和安全性至关重要。以下是在选择
    的头像 发表于 09-20 15:45 ?1015次阅读

    UV LED供电为什么要选择使用恒驱动电源

    LED为何一定要恒供电? 在讨论此议题之前,什么是电源的恒恒压?
    的头像 发表于 08-25 14:55 ?1318次阅读