写给大忙人的Hadoop2
作 者:(美)伊德理恩(Douglas Eadline) 著;卢涛,李颖 译
定 价:69
出 版 社:电子工业出版社
出版日期:2016年06月01日
页 数:271
装 帧:平装
ISBN:9787121288050
●1背景和概念 1
●定义Apache Hadoop 1
●Apache Hadoop的发展简史 3
●大数据的定义 4
●Hadoop作为数据湖 5
●使用Hadoop:管理员、用户或两种身份兼具 7
●原始的MapReduce 7
●Apache Hadoop的设计原则 8
●Apache Hadoop MapReduce示例 8
●MapReduce的优势 10
●Apache Hadoop V1 MapReduce操作 11
●使用Hadoop V2 MapReduce 13
●Hadoop V2 YARN操作设计 14
●Apache Hadoop项目生态系统 16
●总结和补充资料 18
●2安装攻略 21
●核心Hadoop服务 21
●Hadoop配置文件 22
●规划你的资源 23
●硬件的选择 23
●部分目录
内容简介
本书首先介绍了Hadoop的背景知识,包括Hadoop 2和YARN的工作原理和对Hadoop 1的改进,然后将数据湖与传统存储比较。第2章到第8章,分别介绍了Hadoop 2和核心服务的安装方法、Hadoop分布式文件系统、MapReduce和YARN编程,以及利用Apache Pig等Hadoop工具简化编程。很后两章讲述了利用Apache Ambari等工具管理Hadoop和基本的管理程序。附录包括Hadoop 2故障诊断和排除的基础知识、Apache Hue和Apache Spark安装等。本书通俗易懂,具有大量操作实例,易于上手,适合Hadoop用户、管理员、开发和运维人员、程序员、架构师、分析师和数据科学工作者阅读。
(美)伊德理恩(Douglas Eadline) 著;卢涛,李颖 译
卢涛,专业社区ITPUBOracle开发版版主。1995年参加工作,2001年转到IT部门从事C/C++软件开发,2004年开始做系统分析和Oracle数据库方面工作。参加过多个性普查数据处理项目的开发和运维,目前主要从事统计报表联网填报系统的后台支持和优化。曾参与编写《剑破冰山-Oracle开发的艺术》一书,并翻译了数本Oracle管理、开发和性能优化;C/C++开发、Web开发等方面的书籍。
伊德理恩,博士,作为一个Linux集群HPC革命的践行者和记录者开始他的职业生涯,而现在他在记录大数据分析。从开始靠前份操作文档以来,道格写了数百篇文章、白皮书,以及说明文档,涵盖高性能计算(等