本篇主要提供大数据预处理技术电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
第1章 数据预处理概述
1.1 数据预处理的背景与目的
1.1.1 数据预处理的背景:数据质量
1.1.2 数据预处理的目的
1.2 数据预处理的流程
1.2.1 数据清理
1.2.2 数据集成
1.2.3 数据变换
1.2.4 数据归约
1.2.5 数据预处理的注意事项
1.3 数据预处理的工具
第2章 Kettle工具的初步使用
2.1 Kettle的安装
2.1.1 Java的安装
2.1.2 Kettle的下载安装与Spoon的启动
2.2 Kettle的使用
2.2.1 转换的基本概念
2.2.2 个转换案例
第3章 基于Kettle的数据导入与导出
3.1 基于文件的数据导入与导出
3.1.1 文本文件的导入与导出
3.1.2 文本文件的导入与导出案例
3.1.3 Excel文件的导入与导出
3.1.4 Excel文件的导入与导出案例
3.1.5 XML文件的导入与导出
3.1.6 XML文件的导入与导出案例
3.1.7 JSON文件的导入与导出
3.1.8 JSON文件的导入与导出案例
3.2 基于数据库的数据导入与导出
3.2.1 关系型数据库的数据导入与导出
3.2.2 MySQL数据库的数据导入与导出案例
3.3 基于Web的数据导入与导出
3.3.1 HTML数据的导入与导出
3.3.2 HTML数据的导入与导出案例
3.3.3 基于HTTP GET请求的导入与导出
3.3.4 基于HTTP GET请求的导入与导出案例
3.4 基于CDC变 数据的导入与导出
3.4.1 基于源数据的CDC
3.4.2 基于源数据的CDC案例
3.4.3 基于触发器的CDC
3.4.4 基于触发器的CDC案例
3.4.5 基于快照的CDC
3.4.6 基于快照的CDC案例
3.4.7 基于日志的CDC
3.4.8 基于日志的CDC案例
第4章 数据清理
4.1 数据清理概述
4.1.1 常用的数据清理步骤
4.1.2 字符串清理
4.1.3 字段清理