《大数据技术架构:核心原理与应用实践李智慧Hadoop大数据原理与架构数据仓库HiveN0SQ》[85M]百度网盘|pdf下载|亲测有效
《大数据技术架构:核心原理与应用实践李智慧Hadoop大数据原理与架构数据仓库HiveN0SQ》[85M]百度网盘|pdf下载|亲测有效

大数据技术架构:核心原理与应用实践李智慧Hadoop大数据原理与架构数据仓库HiveN0SQ pdf下载

出版社 一键团图书专营店
出版年 2025
页数 390页
装帧 精装
评分 9.1(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供大数据技术架构:核心原理与应用实践李智慧Hadoop大数据原理与架构数据仓库HiveN0SQ电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

a68d5a8c94d4a2d1.jpg

大数据技术架构:核心原理与应用实践
定价 89.00
出版社 电子工业出版社
版次 1
出版时间 2021年06月
开本 16
作者 李智慧
页数
字数
ISBN编码 9787121414183
重量

 内容简介.png
本书以浅显的语言,阐述了大数据的来龙去脉、技术架构及在行业中的应用实践。一套完整的大数据知识体系,将包含6个模块。模块一 Hadoop大数据原理与架构为什么讲大数据都要从Hadoop开始?大数据的问题和挑战不同以往,它的处理方法与技巧也颇有不同。理解大数据面对的问题以及处理技巧,是构建大数据知识体系的源头。理解大数据,从理解Hadoop开始。模块二 大数据生态体系主要产品原理与架构大数据领域不只有Hadoop,还有数据仓库Hive、N0SQL系统HBase、计算引擎Spark、流计算引擎Storm、Flink,以及分布式一致性解决方案ZooKeeper等,它们构成了一个完整的大数据生态体系,解决各种场景下的不同问题。模块三 大数据开发实践本模块以大数据开发#者的视角重新审视大数据的各个方面,结合作者在阿里巴#巴、Intel从事大数据开发的实践经历,从"局内人”的视角为你揭秘大数据开发的内里乾坤。模块四 大数据ping台与系统集成大数据从哪里来?算出来的结果又到哪里去?如何将大数据技术集成到当前系统中去?需不需要自己开发?有没有商业的解决方案?这可能是使用大数据时#迫切需要解决的问题。模块五 大数据分析与运营数据分析是大数据应用的一个重要场景,互联网企业运营常用的数据分析指标有哪些?如何呈现?数据分析结果异常了,企业关键绩效指标下滑了,该如何去追踪定位其原因?这些应用场景和问题答案都可以在本模块中找到。模块六 大数据算法大数据#激动人心的应用还是大数据机器学习,但大数据机器学习算法是不是真的有那么难?数学不好还能不能学好、用好大数据算法呢?这个模块告诉你,其实大数据算法并不难,原理一样很简单。


 目录.png
1  大数据的前世今生与应用场景 1

大数据的前世今生:大数据简史与大数据生态体系概述 1

从搜索引擎到人工智能:大数据应用发展史 6

大数据应用的搜索引擎时代 6

大数据应用的数据仓库时代 7

大数据应用的数据挖掘时代 7

大数据应用的机器学习时代 8

数据驱动一切:大数据全领域应用场景分析 10

大数据在医疗健康领域的应用 10

大数据在社交媒体领域的应用 12

大数据在金融领域的应用 13

大数据在新零售领域的应用 13

大数据在交通领域的应用 13

2  Hadoop大数据原理与架构 15

移动计算比移动数据更划算 16

从RAID看垂直伸缩到水ping伸缩的演化 19

新技术层出不穷,HDFS依然是存储的王者 23

为什么说MapReduce既是编程模型又是计算框架 29

MapReduce如何让数据完成一次旅行 33

MapReduce作业启动和运行机制 34

MapReduce数据合并与连接机制 37

为什么把Yarn称为资源调度框架 39

程序员应该如何学好大数据技术 44

3  大数据生态体系主要产品原理与架构 47

Hive是如何让MapReduce实现SQL操作的 47

用MapReduce实现SQL数据分析的原理 48

Hive的架构 49

Hive如何实现join操作 51

人们并没有觉得MapReduce速度慢,直到Spark出现 53

同样的本质,为何Spark可以更高效 57

Spark的计算阶段 57

Spark的作业管理 61

Spark的执行过程 62

BigTable的开源实现:HBase 63

HBase可伸缩架构 64

HBase可扩展数据模型 65

HBase的高性能存储 66

流式计算的代表:Storm、Spark Streaming、Flink 68

Storm 68

Spark Streaming 70

Flink 71

ZooKeeper是如何保证数据一致性的 74

分布式一致性原理 75

Paxos算法与ZooKeeper架构 76

大数据技术应用场景分析 80

4  大数据开发实践 82

如何自己开发一个大数据SQL引擎 83

Panthera架构 83

Panthera的SQL语法转换 84

比如这条SQL 85

Panthera程序设计 85

Spark的性能优化案例分析 89

Apache开源社区的组织和参与方式 90

软件性能优化 91

大数据开发的性能优化 91

Spark性能优化 92

案例1:Spark任务文件初始化调优 95

案例2:Spark任务调度优化 98

案例3:Spark应用配置优化 102

案例4:操作系统配置优化 102

案例5:硬件优化 103

大数据基准测试可以带来什么好处 105

大数据基准测试的应用 105

大数据基准测试工具HiBench 107

从大数据性能测试工具Dew看如何快速开发大数据系统 109

Dew设计与开发 110

Akka的原理与应用 112

大数据开发实践的启示 115

5  大数据ping台与系统集成 117

大数据ping台 = 互联网产品 + 大数据产品 117

数据采集 119

数据处理 119

数据输出与展示 119

大数据任务调度 120

大数据ping台Lamda架构 120

数据在大数据ping台中的流转 121

大数据从哪里来 123

从数据库导入 123

从日志文件导入 124

前端埋点采集 126

爬虫系统 128

数据的熵 128

知名大厂如何搭建大数据ping台 129

淘宝大数据ping台 129

美团大数据ping台 130

滴滴大数据ping台 131

学架构就是学架构模式 133

盘点可供中小企业参考的商业大数据ping台 134

大数据解决方案提供商 134

大数据云计算服务商 136

大数据SaaS服务商 138

大数据开放ping台 138

当大数据遇上物联网 139

物联网应用场景分析 139

物联网ping台架构 140

大数据技术在物联网中的应用 141

6  大数据分析与运营 144

老板想要监控什么运营指标 144

互联网运营的常用数据指标 145

数据可视化图表与数据监控 147

一个用户新增下降的数据分析案例 150

数据分析案例 151

数据分析方法 154

AB测试与灰度发布必知必会 156

A/B测试的过程 157

A/B测试的系统架构 158

灰度发布 159

如何利用大数据成为“增长黑客” 160

Hotmail的增长黑客故事 161

AARRR用户增长模型 161

利用大数据增长用户数量 163

为什么说数据驱动运营 164

7  大数据算法与机器学习 168

如何对数据进行分类和预测 168

k近邻分类算法 169

数据的距离 170

文本的特征值 171

贝叶斯分类 172

如何发掘数据的关系 174

搜索排序 174

关联分析 177

聚类 179

如何预测用户的喜好 181

基于人口统计的# 182

基于商品属性的# 183

基于用户的协同过滤# 184

基于商品的协同过滤# 185

机器学习的数学原理是什么 186

样本 187

模型 187

算法 188

为什么学机器学习要学数学 189

从感知机到神经网络 190

感知机 191

神经网络 192

^_^:75b89a890c1d168b514eb7eb6a0a140a