本篇主要提供图解Spark大数据快速分析实战电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法。
Spark 是专为大规模数据处理而设计的快速通用的计算引擎,本书涵盖 Spark 3.0 新特性。
本书结合大量原理图和流程图,系统介绍Spark内核的相关技术。
本书注重实战,图文并茂,系统讲解了Spark内核原理、Spark实战应用、 Spark数据源、Spark流式计算、Spark性能调优和数据湖等内容。
通过本书,读者不仅可以深入理解Spark的原理、使应用、运维、监控等技术,还可以快速编写出性能更好、可靠性更高的大数据应用。
本书主要内容:
.Spark内核的原理
.Spark的作业调度和资源分配算法
.Spark SQL、DataFrame、Dataset的原理和实战
.Spark数据源
.Spark 流式计算原理和实战
.Spark 亿级数据处理平台Spark性能调优
.Spark机器学习库
.Spark 3.0的新特性和数据湖等
本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,Spark SQL、DataFrame、Dataset的原理和实战,深入理解Spark数据源,流式计算的原理和实战,亿级数据处理平台Spark性能调优,Spark机器学习库,Spark 3.0的新特性和数据湖等。
本书适合Spark开发人员和Spark运维人员阅读。
王磊,阿里云MVP(Z有价值专家)、易点天下大数据架构师,《Offer来了:Java面试核心知识点精讲(原理篇)》和《Offer来了:Java面试核心知识点精讲(框架篇)》的作者,极客时间每日一课专栏作者;喜欢读书和研究新技术,长期从事物联网和大数据研发工作;有十余年丰富的物联网及大数据研发和技术架构经验,对物联网及大数据的原理和技术实现有深刻理解;长期从事海外项目的研发和交付工作,对异地多活数据中心的建设及高可用、高并发系统的设计有丰富的实战经验。