《Spark3.0大数据分析与挖掘:基于机器学习王晓华》[96M]百度网盘|pdf下载|亲测有效
《Spark3.0大数据分析与挖掘:基于机器学习王晓华》[96M]百度网盘|pdf下载|亲测有效

Spark3.0大数据分析与挖掘:基于机器学习王晓华 pdf下载

出版社 义博图书专营店
出版年 2022-03
页数 390页
装帧 精装
评分 8.9(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供Spark3.0大数据分析与挖掘:基于机器学习王晓华电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com




书名:  Spark 3.0大数据分析与挖掘:基于机器学习
 出版社:  清华大学出版社
 出版日期  2022
 ISBN号:  9787302598992





Spark作为新兴的、应用范围广泛的大数据处理开源框架,吸引了大量的大数据分析与挖掘从业人员进行相关内容的学习与开发,其中ML是Spark 3.0机器学习框架使用的核心。本书用于Spark 3.0 ML大数据分析与挖掘入门,配套示例源码、PPT课件、数据集、思维导图、开发环境和作者答疑服务。

本书共分13章,从Spark 3.0大数据分析概述、基础安装和配置开始,依次介绍ML的DataFrame、ML的基本概念,以及协同过滤、线性回归、分类、决策树与随机森林、聚类、关联规则、数据降维、特征提取和转换等数据处理方法;后通过经典的鸢尾花分析实例,回顾前面的学习内容,实现了一个完整的数据分析与挖掘过程。

本书采取实例和理论相结合的方式,讲解细致直观,示例丰富,适合Spark 3.0机器学习初学者、大数据分析和挖掘人员,也适合高等院校和培训机构人工智能与大数据相关专业的师生教学参考。





王晓华,计算机专业讲师,研究方向为云计算、大数据与人工智能。著有《Spark MLlib机器学习实践》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战:基于TensorFlow2.2的深度学习实践》《TensorFlow深度学习从零开始学》《深度学习的数学原理与实现》等图书。






1章  Spark大数据分析概述 1
1.1  大数据时代 1
1.2  大数据分析的要素 2
1.3  简单、优雅、有效—这就是Spark 3
1.4  Spark 3.0核心—ML 4
1.5  星星之火,可以燎原 6
1.6  小结 6
2章  Spark 3.0安装和开发环境配置 7
2.1  Windows 10单机模式下安装和配置Spark 7
2.1.1  Windows 10安装Java 8 7
2.1.2  Windows 10安装Scala 2.12.10 10
2.1.3  Intellij IDEA下载和安装 13
2.1.4  Intellij IDEA中Scala插件的安装 13
2.1.5  HelloJava—使用Intellij IDEA创建Java程序 16
2.1.6  HelloScala—使用Intellij IDEA创建Scala程序 19
2.1.7  后一脚—Spark 3.0单机版安装 22
2.2  经典的wordCount 25
2.2.1  Spark 3.0实现wordCount 25
2.2.2  MapReduce实现wordCount 27