本篇主要提供Hadoop与大数据挖掘电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
张良均、樊哲、位文超、刘名军等著的这本
《Hadoop与大数据挖掘》是一本适合教学和零基础自
学的Hadoop与大数据挖掘的教程,即便你 没有
Hadoop编程基础和大数据挖掘基础,根据本书中的理
论知识和上机实践,也能迅速掌握如何使用Hadoop进
行大数据挖掘。
本书已经被诸多高校预定为教材,为了便于教学
,书中提供了大量上机实验的教学资源。
全书主要分为两篇: 部分基础篇,首先从宏
观上介绍了大数据相关概念和技术,然后逐一对
Hadoop、Hive、HBase、Pig、Spark、Oozie等一系
列大数据技术的概念、原理、架构,以及企业应用方
法进行了详细介绍,同时配有大量的案例。掌握了这
些内容,就具备了大数据技术的基础。第二部分挖掘
实战篇,详细介绍了一个企业级大数据应用项目——
电子商务智能 系统。通过分析应用背景、构建系
统,使读者了解针对系统的每一层应用使用什么大数
据技术来解决问题。涉及的流程有数据采集、数据预
处理、模型构建等,在每一个流程中会进行大数据相
关技术实践,运用实际数据来进行分析,使读者切身
感受到利用大数据技术解决问题的魅力。
张良均, 大数据挖掘专家和模式识别专家,有10多年的大数据挖掘应用、咨询经验,10余年数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。为电信、电力、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验 丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》等畅销书。
前言
篇 基础篇
第1章 浅谈大数据
1.1 大数据概述
1.2 大数据平台
1.3 本章小结
第2章 大数据存储与运算利器—Hadoop
2.1 Hadoop概述
2.1.1 Hadoop简介
2.1.2 Hadoop存储—HDFS
2.1.3 Hadoop计算—MapReduce
2.1.4 Hadoop资源管理—YARN
2.1.5 Hadoop生态系统
2.2 Hadoop配置及IDE配置
2.2.1 准备工作
2.2.2 环境配置
2.2.3 集群启动关闭与监控
2.2.4 动手实践:一键式Hadoop集群启动关闭
2.2.5 动手实践:Hadoop IDE配置
2.3 Hadoop集群命令
2.3.1 HDFS常用命令hdfs dfs
2.3.2 动手实践:hdfs dfs命令实战
2.3.3 MapReduce常用命令mapred job
2.3.4 YARN常用命令yarn jar
2.3.5 动手实践:运行MapReduce任务
2.4 Hadoop编程开发
2.4.1 HDFS Java API操作
2.4.2 MapReduce原理
2.4.3 动手实践:编写Word Count程序并打包运行
2.4.4 MapReduce组件分析与编程实践
2.5 K-Means算法原理及HadoopMapReduce实现
2.5.1 K-Means算法原理
2.5.2 动手实践:K-Means算法实现
2.5.3 Hadoop K-Means算法实现思路
……
第3章 大数据查询—Hive
第4章 大数据快速读写—HBase
第5章 大数据处理—Pig
第6章 大数据快速运算与挖掘—Spark
第7章 大数据工作流—Oozie
第二篇 挖掘实战篇
第8章 法律服务大数据智能