《scikit-learn机器学习实战》[95M]百度网盘|pdf下载|亲测有效
《scikit-learn机器学习实战》[95M]百度网盘|pdf下载|亲测有效

scikit-learn机器学习实战 pdf下载

出版社 清华大学出版社京东自营官方旗舰店
出版年 2022-05
页数 390页
装帧 精装
评分 9.3(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供scikit-learn机器学习实战电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

涵盖机器学习模型和scikit-learn使用技巧、基本工具和实现方法,循序渐进地讲解相关机器学习算法,带你轻松踏上机器学习之旅。

采用理论与实践相结合的方式,结合Python 3的强大功能,以最小的编程代价实现机器学习算法。

全程以真实案例驱动,详解机器学习的基本概念、算法流程、模型构建、数据训练、模型评估与调优、必备工具和实现方法。


内容简介

本书围绕scikit-learn库,详细介绍机器学习模型、算法、应用场景及其案例实现方法,通过对相关算法循序渐进的讲解,带你轻松踏上机器学习之旅。本书采用理论与实践相结合的方式,结合Python3语言的强大功能,以最小的编程代价来实现机器学习算法。本书配套PPT课件、案例源码、数据集、开发环境与答疑服务。

本书共分13章,内容包括机器学习的基础理论、模型范式、策略、算法以及机器学习的应用开发,涵盖特征提取、简单线性回归、k近邻算法、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K均值算法、主成分分析等热点研究领域。

本书可以作为机器学习初学者、研究人员或从业人员的参考书,也可以作为计算机科学、大数据、人工智能、统计学和社会科学等专业的大学生或研究生的教材。


作者简介

邓立国,东北大学计算机应用博士毕业。广东工业大学任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。著有图书《scikit-learn机器学习实战》《Python数据分析与挖掘实战》《Python大数据分析算法与实例》《Python机器学习算法与应用》《数据库原理与应用(SQL Server 2016版本)》等图书。


内页插图

目录

第1章 机器学习概述 3

1.1 什么是机器学习 4

1.2 机器学习的作用领域 6

1.3 机器学习的分类 7

1.4 机器学习理论基础 8

1.5 机器学习应用开发的典型步骤 9

1.6 本章小结 10

1.7 复习题 11

第2章 机器学习之数据特征 12

2.1 数据分布性 12

2.2 数据相关性 22

2.3 数据聚类性 27

2.4 数据主成分分析 30

2.5 数据动态性 37

2.6 数据可视化 40

2.7 本章小结 42

2.8 复习题 43

第3章 用scikit-learn估计器分类 44

3.1 scikit-learn基础 44

3.2 scikit-learn估计器 47

3.3 本章小结 52

3.4 复习题 52

第4章 朴素贝叶斯分类 53

4.1 算法原理 53

4.2 朴素贝叶斯分类 57

4.3 朴素贝叶斯分类实例 61

4.4 朴素贝叶斯连续值的处理 65

4.5 本章小结 67

4.6 复习题 67

第5章 线性回归 68

5.1 简单的线性回归模型 68

5.2 分割数据集 73

5.3 用简单线性回归模型预测考试成绩 77

5.4 本章小结 82

5.5 复习题 82

第6章 用k近邻算法分类和回归 83

6.1 k近邻算法模型 83

6.2 用k近邻算法处理分类问题 87

6.3 用k近邻算法对鸢尾花进行分类 89

6.4 用k近邻算法进行回归拟合 92

6.5 本章小结 95

6.6 复习题 95

第7章 从简单线性回归到多元线性回归 97

7.1 多变量的线性模型 97

7.2 模型的优化 100

7.3 用多元线性回归模型预测波士顿房价 108

7.4 本章小结 115

7.5 复习题 115

第8章 从线性回归到逻辑回归 116

8.1 逻辑回归模型 116

8.2 多元分类问题 120

8.3 正则化项 123

8.4 模型优化 124

8.5 用逻辑回归算法处理二分类问题 126

8.6 识别手写数字的多元分类问题 132

8.7 本章小结 136

8.8 复习题 137

第9章 非线性分类和决策树回归 138

9.1 决策树特点 139

9.2 决策树分类 140

9.3 决策树回归 142

9.4 决策树复杂度及使用技巧 145

9.5 决策树算法:ID3、C4.5和CART 146

9.6 本章小结 148

9.7 复习题 149

第10章 集成方法:从决策树到随机森林 150

10.1 Bagging元估计器 150

10.2 由随机树组成的森林 151

10.3 AdaBoost 155

10.4 梯度树提升 156

10.5 本章小结 167

10.6 复习题 167

第11章 从感知机到支持向量机 168

11.1 线性支持向量机分类 168

11.2 非线性支持向量机分类 174

11.3 支持向量机回归 181

11.4 本章小结 184

11.5 复习题 185

第12章 从感知机到人工神经网络 186

12.1 从神经元到人工神经元 186

12.2 感知器 189

12.3 多层感知器 194

12.4 本章小结 199

12.5 复习题 200

第13章 主成分分析降维 201

13.1 数据的向量表示及降维问题 201

13.2 向量的表示及基变换 202

13.3 协方差矩阵及优化目标 205

13.4 PCA算法流程 209

13.5 PCA实例 210

13.6 scikit-learn PCA降维实例 211

13.7 核主成分分析KPCA简介 216

13.8 本章小结 217

13.9 复习题 217

参考文献 218

前言/序言

机器学习实际上已经存在了几十年,或者也可以认为存在了几个世纪。追溯到17世纪,贝叶斯、拉普拉斯关于最小二乘法的推导和马尔可夫链,这些构成了机器学习广泛使用的工具和基础。从1950年艾伦·图灵提议搭建一个学习机器开始,到2000年年初深度学习的实际应用以及最近的进展,比如2012年的AlexNet,机器学习有了很大的发展。

scikit-learn项目最早由数据科学家 David Cournapeau在2007年发起,需要NumPy和SciPy等其他包的支持,它是Python语言中专门针对机器学习应用而发展起来的一款开源框架。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构并使之不断改善自身的性能。它是人工智能的核心,即使计算机具有智能的根本途径。

本书针对机器学习这个领域,描述了多种学习模型、策略、算法、理论以及应用,基于Python3使用scikit-learn工具包演示算法解决实际问题的过程。对机器学习感兴趣的读者可通过本书快速入门,快速胜任机器学习岗位,成为人工智能时代的人才。

读者需要了解的重要信息

本书作为机器学习专业图书,介绍机器学习的基本概念、算法流程、模型构建、数据训练、模型评估与调优、必备工具和实现方法,全程以真实案例驱动,案例采用Python3实现。本书涵盖数据获得、算法模型、案例代码实现和结果展示的全过程,以机器学习的经典算法为轴线:算法分析→数据获取→模型构建→推断→算法评估。本书案例具有代表性,结合了理论与实践,并能明确机器学习的目标及完成效果。

本书内容

本书共分13章,系统讲解机器学习的典型算法,内容包括机器学习概述、数据特征提取、scikit-learn估计器分类、朴素贝叶斯分类、线性回归、k近邻算法分类和回归、从简单线性回归到多元线性回归、从线性回归到逻辑回归、非线性分类和决策树回归、从决策树到随机森林、从感知机到支持向量机、从感知机到人工神经网络、主成分分析降维。

本书的例子都是在Python3集成开发环境Anaconda3中经过实际调试通过的典型案例,同时本书配备了案例的源码和数据集供读者参考。

配套资源下载

本书配套的案例源码、PPT课件、数据集、开发环境和答疑服务,需要使用微信扫描下边的二维码下载,可按扫描后的页面提示,把链接转发到自己的邮箱中下载。如果有疑问,请联系booksaga@163.com,邮件主题写“scikit-learn机器学习实战”。


本书读者

本书适合大数据分析与挖掘、机器学习与人工智能技术的初学者、研究人员及从业人员,也适合作为高等院校和培训机构大数据、机器学习与人工智能相关专业的师生教学参考。

致 谢

本书完成之际,感谢合作者与清华大学出版社各位老师的支持。作者夜以继日用了近一年的时间写作,并不断修正错误和完善知识结构。由于作者水平有限,书中有纰漏之处还请读者不吝赐教。本书写作过程中参考的图书与网络资源都在参考文献中给出了出处。



邓立国

2022年1月