ytblog
首页博客关于

标签

Shuffle

共 4 篇文章

2026-05-214 min read

SOAR-Flow: SOAR Automation with Shuffle, Wazuh & TheHive | This project integrates Shuffle SOAR, Wazuh SIEM, an

深入分析 GitHub 趋势项目 SOAR-Flow,探讨其技术架构、应用场景和社区价值。

GitHubShuffleIo
第 2 篇
2026-05-173 min read

DAG、Stage、Task、Shuffle:分布式计算的基本模型

分布式计算引擎通常把作业表达成 DAG,再切成 Stage 和 Task 并行执行,Shuffle 则是性能和稳定性最关键的成本来源。

计算引擎DAGStageTaskShuffle
第 4 篇
2026-05-173 min read

Spark SQL 与 Shuffle 优化

Spark SQL 性能优化的核心是理解 Catalyst、Join 策略、Shuffle、数据倾斜和分区设计。

计算引擎Spark SQLShuffleJoin性能优化
第 13 篇
2026-05-173 min read

数据倾斜治理:Spark 和 Flink 都绕不开的问题

数据倾斜会让少数 Task 成为瓶颈,常见治理方式包括热 key 识别、加盐、两阶段聚合、广播 Join 和动态拆分。

计算引擎数据倾斜SparkFlinkShuffle