ytblog | 技术博客

共 10 篇文章

2026-06-284 min read

data-engineering-zoomcamp: Data Engineering Zoomcamp is a free 9-week course on building production-ready data pipelines. The n

深入分析 GitHub 趋势项目 data-engineering-zoomcamp，探讨其技术架构、应用场景和社区价值。

2026-06-154 min read

深入分析 GitHub 趋势项目 kafka，探讨其技术架构、应用场景和社区价值。

2026-06-114 min read

深入分析 GitHub 趋势项目 flink-cdc，探讨其技术架构、应用场景和社区价值。

2026-06-104 min read

深入分析 GitHub 趋势项目 flink-learning，探讨其技术架构、应用场景和社区价值。

2026-05-222 min read

深入解析 Kafka 核心架构、消息模型和生产实践

第 5 篇

2026-05-1710 min read

实时分析架构的核心不是堆组件，而是把业务事件稳定地采集、缓冲、计算并写入适合查询的分析型数据库。

第 3 篇

2026-05-174 min read

Kafka 的核心不是传统队列，而是分布式提交日志。它通过分区、顺序追加、批量 IO 和消费者 Offset 支撑高吞吐数据流。

第 8 篇

2026-05-173 min read

消息队列选型不要只看吞吐，还要看业务语义、消费模型、延迟、顺序性、事务能力、运维成本和团队经验。

第 10 篇

2026-05-173 min read

Kafka + Flink 是实时数据链路里的经典组合，Kafka 负责承接数据流，Flink 负责清洗、窗口计算和状态处理。

第 9 篇

2026-05-172 min read

实时指标链路通常由 Kafka 承接事件，Flink 清洗和聚合，OLAP 数据库承接明细与指标查询。