第 3 篇2026-05-173 min readSpark 篇:为什么 Spark 适合大规模离线计算Spark 通过 Driver、Executor、RDD、DataFrame 和 Spark SQL 组成一套通用分布式计算引擎,尤其适合大规模离线 ETL 和分析。计算引擎SparkRDDDataFrameSpark SQL