《大数据预处理技术》[87M]百度网盘|pdf下载|亲测有效
《大数据预处理技术》[87M]百度网盘|pdf下载|亲测有效

大数据预处理技术 pdf下载

出版社 浙刊总社图书专营店
出版年 2019-04
页数 390页
装帧 精装
评分 9.2(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供大数据预处理技术电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

基本信息

  • 商品名称:大数据预处理技术(数据科学与大数据技术专业系列规划教材)
  • 作者:编者:朱晓姝//许桂秋
  • 定价:55
  • 出版社:人民邮电
  • ISBN号:9787115503510

其他参考信息(以实物为准)

  • 出版时间:2019-04-01
  • 印刷时间:2019-04-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:253
  • 字数:471千字

目录

第1章 数据预处理概述
1.1 数据预处理的背景与目的
1.1.1 数据预处理的背景:数据质量
1.1.2 数据预处理的目的
1.2 数据预处理的流程
1.2.1 数据清理
1.2.2 数据集成
1.2.3 数据变换
1.2.4 数据归约
1.2.5 数据预处理的注意事项
1.3 数据预处理的工具
第2章 Kettle工具的初步使用
2.1 Kettle的安装
2.1.1 Java的安装
2.1.2 Kettle的下载安装与Spoon的启动
2.2 Kettle的使用
2.2.1 转换的基本概念
2.2.2 个转换案例
第3章 基于Kettle的数据导入与导出
3.1 基于文件的数据导入与导出
3.1.1 文本文件的导入与导出
3.1.2 文本文件的导入与导出案例
3.1.3 Excel文件的导入与导出
3.1.4 Excel文件的导入与导出案例
3.1.5 XML文件的导入与导出
3.1.6 XML文件的导入与导出案例
3.1.7 JSON文件的导入与导出
3.1.8 JSON文件的导入与导出案例
3.2 基于数据库的数据导入与导出
3.2.1 关系型数据库的数据导入与导出
3.2.2 MySQL数据库的数据导入与导出案例
3.3 基于Web的数据导入与导出
3.3.1 HTML数据的导入与导出
3.3.2 HTML数据的导入与导出案例
3.3.3 基于HTTP GET请求的导入与导出
3.3.4 基于HTTP GET请求的导入与导出案例
3.4 基于CDC变 数据的导入与导出
3.4.1 基于源数据的CDC
3.4.2 基于源数据的CDC案例
3.4.3 基于触发器的CDC
3.4.4 基于触发器的CDC案例
3.4.5 基于快照的CDC
3.4.6 基于快照的CDC案例
3.4.7 基于日志的CDC
3.4.8 基于日志的CDC案例
第4章 数据清理
4.1 数据清理概述
4.1.1 常用的数据清理步骤
4.1.2 字符串清理
4.1.3 字段清理