本篇主要提供Scikit-learn机器学习详解电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
本书主要内容包括机器学习介绍,NumPy、 Pandas、SciPy库、Matplotlib(可视化)四个基 础模块,Scikit-learn算法、模型、拟合、过拟合 、欠拟合、模型性能度量指标、数据标准化、非线 性转换、离散化,以及特征抽取和降维的各种方法 ,包括特征哈希、文本特征抽取、特征聚合等。全 书通过实用范例和图解形式讲解,选材典型,案例 丰富,适合从事大数据、数据挖掘、机器学习等人 工智能领域开发的各类人员。
1 机器学习
1.1 机器学习和人工智能
1.2 机器学习和大数据
1.3 机器学习和数据挖掘
1.4 机器学习分类和应用
1.5 机器学习开发步骤
1.5.1 数据挖掘标准流程
1.5.2 机器学习开发步骤
本章小结
2 Scikit-learn预备知识
2.1 NumPy
2.1.1 NumPy数组概念
2.1.2 NumPy数据类型
2.1.3 NumPy数组创建
2.1.4 NumPy数组操作
2.1.5 NumPy随机数
2.1.6 NumPy输入输出
2.1.7 NumPy矩阵
2.1.8 NumPy线性代数
2.1.9 NumPy常数
2.2 Pandas
2.2.1 Pandas数据结构
2.2.2 Pandas顶层函数
2.2.3 Pandas应用举例
2.3 SciPy库
2.3.1 SciPy库基础知识
2.3.2 稀疏矩阵及其处理
2.3.3 SciPy库应用举例
2.4 Matplotlib
2.4.1 Matplotlib基础知识
2.4.2 Matplotlib应用举例
本章小结
3 Scikit-learn基础应用
3.1 机器学习的算法和模型
3.1.1 特征变量和目标变量
3.1.2 算法训练
3.1.3 过拟合和欠拟合
3.1.4 模型性能度量
3.2 模型选择
3.3 Scikit-learn的功能模块
3.4 Scikit-learn 应用
3.4.1 安装Scikit-learn
3.4.2 数据导入
3.4.3 模型持久化
3.4.4 文本数据处理
3.4.5 随机状态控制
3.4.6 分类型变量处理
3.4.7 Pandas数据框处理
3.4.8 输入输出约定
3.5 应用实例