本篇主要提供大数据开发者教程电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
模块1 额外的Hadoop工具:ZooKeeper、Sqoop、Flume、YARN和Storm
讲 用ZooKeeper进行分布式处理协调
1.1 ZooKeeper简介
1.1.1 ZooKeeper的好处
1.1.2 ZooKeeper术语
1.1.3 ZooKeeper命令行界面(CLI)
1.2 安装和运行ZooKeeper
1.2.1 支持的平台
1.2.2 所需的软件
1.2.3 单服务器的安装
1.3 使用ZooKeeper
1.4 ZooKeeper应用程序
1.4.1 FS爬取
1.4.2 Katta
1.4.3 Yahoo!消息代理(YMB)
1.5 使用ZooKeeper构建应用程序
1.5.1 Exec.java
1.5.2 处理事件
1.5.3 监控数据
1.5.4 实现屏障和生产者-消费者队列
练习
备忘单
第2讲 利用Sqoop有效地传输批量数据
2.1 Sqoop简介
2.1.1 Sqoop中的工作流
2.1.2 Sqoop的特性
2.2 使用Sqoop 1
2.3 用Sqoop导入数据
2.3.1 导入完整的表
2.3.2 用HBase Sqoop导入带有复合键的表
2.3.3 目标目录
2.3.4 导入选择的行
2.3.5 密码保护
2.3.6 用不同的文件格式导入数据
2.3.7 导入数据压缩
2.4 控制并行
2.5 编码NULL值
2.6 将数据导入Hive表
2.7 将数据导入HBase
2.7.1 使用自由形式查询
2.7.2 重命名Sqoop作业
2.8 导出数据
2.8.1 批量导出
2.8.2 原子导出
2.9 将数据导出至列的子集
2.10 Sqoop中的驱动程序和连接器
2.10.1 驱动程序
2.10.2 连接器
2.10.3 连接到数据库
……