Apache Spark 开源集群计算框架
- 大数据技术和Spark概述
- 通过实例学习DataFrame、SQL、Dataset等Spark的核心API
- 了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程
- 了解Spark如何在集群上运行
- Spark集群和应用程序的调试、监控、和调优
- 学习Spark强大的流处理引擎 - 结构化流处理
- 学习MLlib并了解如何使用它解决分类、推荐、以及其他多种实际问题
第 I 部分 大数据与Spark概述
Spark - 第1章 Spark是什么?
Spark - 第2章 浅析Spark
第 II 部分 结构化API - DataFrame、SQL和Dataset
第 III 部分 低级API
第 IV 部分 生产与应用
第 V 部分 流处理
第 VI 部分 高级分析与机器学习
第 VII 部分 生态系统