《SparkStreaming实时流式大数据处理实战》[86M]百度网盘|pdf下载|亲测有效
《SparkStreaming实时流式大数据处理实战》[86M]百度网盘|pdf下载|亲测有效

SparkStreaming实时流式大数据处理实战 pdf下载

出版社 出版集团图书专营店
出版年 2019-05
页数 390页
装帧 精装
评分 8.8(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供SparkStreaming实时流式大数据处理实战电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

基本信息

  • 商品名称:Spark Streaming实时流式大数据处理实战
  • 作者:编者:肖力涛
  • 定价:69
  • 出版社:机械工业
  • ISBN号:9787111624325

其他参考信息(以实物为准)

  • 出版时间:2019-05-01
  • 印刷时间:2019-05-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:233

目录

前言
第1篇 Spark基础
第1章 初识Spark
1.1 Spark由来
1.2 流式处理与Spark Streaming
1.2.1 流式处理框架
1.2.2 Spark Streaming初识
1.2.3 Structed Streaming简述
1.3 本章小结
第2章 Spark运行与开发环境
2.1 Spark的下载与安装
2.2 Spark运行模式
2.2.1 本地模式
2.2.2 本地集群模式
2.2.3 Standalone模式
2.2.4 Spark On Yarn模式
2.2.5 Spark On Mesos模式
2.3 搭建开发环境
2.3.1 修改配置
2.3.2 启动集群
2.3.3 IDE配置
2.3.4 UI监控界面
2.4 实例——Spark文件词频统计
2.5 本章小结
第3章 Spark编程模型
3.1 RDD概述
3.2 RDD存储结构
3.3 RDD操作
3.3.1 Transformation操作
3.3.2 Action操作
3.4 RDD间的依赖方式
3.4.1 窄依赖(Narrow Dependency)
3.4.2 Shuffle依赖(宽依赖Wide Dependency)
3.5 从RDD看集群调度
3.6 RDD持久化(Cachinng/Persistence)
3.7 共享变量
3.7.1 累加器(Accumulator)
3.7.2 广播变量(Broadcast Variables)
3.8 实例——Spark RDD操作
3.9 本章小结
第2篇 Spark Streaming详解
第4章 Spark Streaming编程模型及原理
4.1 DStream数据结构
4.2 DStream操作
4.2.1 DStream Transformation操作
4.2.2 DStream输出操作
4.3 Spark Streaming初始化及输入源
4.3.1 初始化流式上下文(StreamingContext)
4.3.2 输入源及接收器(Receivers)
4.4 持久化、Checkpointing和共享变量