《基于Hadoop与Spark的大数据开发实战》[45M]百度网盘|pdf下载|亲测有效

基本信息

商品名称：基于Hadoop与Spark的大数据开发实战(新技术技能人才培养系列教程)/大数据开
作者：编者:肖睿//丁科//吴刚山
定价：66.8
出版社：人民邮电
ISBN号：9787115477644

其他参考信息（以实物为准）

出版时间：2018-04-01
印刷时间：2018-04-01
版次：1
印次：1
开本：16开
包装：平装
页数：367
字数：566千字

内容提要

大数据技术让我们以一种的方式，对海量数据进行分析，从中获得有巨大价值的产品和服务，终形成变革之力。肖睿、丁科、吴刚山主编的《基于Hadoop与Spark的大数据开发实战(新技术技能人才培养系列教程)/大数据开发实战系列》围绕Hadoop 和Spark两个主流大数据技术进行讲解，主要内容包括Hadoop环境配置、Hadoop分布式文件系统（HDFS）、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库 HBase、数据仓库Hive、大数据离线处理辅助系统、 Spark Core、Spark SQL、Spark Streaming等知识。
     本书紧密结合实际应用，运用大量案例说明和实践，提炼含金量十足的开发经验。另外，本书配以多元的学习资源和支持服务，包括视频教程、案例素材下载、学习交流社区、讨论组等学习内容，为读者带来的学习体验。
     本书适合作为计算机、大数据相关专业的教材使用，也适合具有一定Linux、Java开发经验，并且想从事大数据开发的人员使用，也可作为大数据分析与运维人员的参考用书。

序言
前言
关于引用作品的版权声明
第1章 Hadoop初体验
任务1 初识大数据
1.1.1 大数据基本概念
1.1.2 大数据带来的挑战
任务2 初识Hadoop
1.2.1 Hadoop概述
1.2.2 Hadoop生态圈
1.2.3 Hadoop应用案例
任务3 安装Hadoop平台
1.3.1 安装虚拟机
1.3.2 安装Linux系统
1.3.3 安装Hadoop伪分布式环境
本章总结
本章练习
第2章 Hadoop分布式文件系统
任务1 HDFS入门
2.1.1 认识HDFS
2.1.2 HDFS基础
2.1.3 HDFS架构
任务2 HDFS基本操作
2.2.1 使用HDFS shell访问
2.2.2 使用Java API访问
任务3 HDFS运行原理
2.3.1 HDFS读写流程
2.3.2 HDFS副本机制
2.3.3 HDFS负载均衡
2.3.4 HDFS机架感知
任务4 HDFS 知识
2.4.1 Hadoop序列化机制
2.4.2 SequenceFile
2.4.3 MapFile
本章总结
本章练习
第3章 Hadoop分布式计算框架
任务1 认识MapReduce编程模型
3.1.1 MapReduce基础
3.1.2 MapReduce编程模型
3.1.3 MapReduce词频统计编程实例
任务2 MapReduce应用开发
3.2.1 MapReduce输入/输出类型
3.2.2 MapReduce输入格式
3.2.3 MapReduce输出格式
3.2.4 Combiner操作
3.2.5 Partitioner操作
3.2.6 自定义RecordReader
任务3 MapReduce 应用
3.3.1 使用MapReduce实现join操作