ytblog
首页博客关于

标签

RDD

共 1 篇文章

第 3 篇
2026-05-173 min read

Spark 篇:为什么 Spark 适合大规模离线计算

Spark 通过 Driver、Executor、RDD、DataFrame 和 Spark SQL 组成一套通用分布式计算引擎,尤其适合大规模离线 ETL 和分析。

计算引擎SparkRDDDataFrameSpark SQL