第 4 篇2026-05-173 min readSpark SQL 与 Shuffle 优化Spark SQL 性能优化的核心是理解 Catalyst、Join 策略、Shuffle、数据倾斜和分区设计。计算引擎Spark SQLShuffleJoin性能优化