《R语言与数据挖掘*佳实践和经典案例》[47M]百度网盘|pdf下载|亲测有效
《R语言与数据挖掘*佳实践和经典案例》[47M]百度网盘|pdf下载|亲测有效

R语言与数据挖掘*佳实践和经典案例 pdf下载

出版社 木垛图书旗舰店
出版年 2014-09
页数 390页
装帧 精装
评分 8.8(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供R语言与数据挖掘*佳实践和经典案例电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

基本信息

  • 商品名称:R语言与数据挖掘*佳实践和经典案例/计算机科学丛书
  • 作者:(澳)赵彦昌|译者:陈健//黄琰
  • 定价:49
  • 出版社:机械工业
  • ISBN号:9787111475415

其他参考信息(以实物为准)

  • 出版时间:2014-09-01
  • 印刷时间:2014-09-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:205

编辑推荐语

数据挖掘技术已经广泛用于政府机关、银行、保险、零售、电信、医药和研究领域。*近。越来越多的数据挖掘工作开始使用R工具来完成,R是一个用于统计计算和制图的免费软件。在*近的调查中,R已经被评为数据挖掘领域*流行的工具。赵彦昌编著的《R语言与数据挖掘*佳实践和经典案例》介绍将R语言用于数据挖掘应用(从学术研究到工业应用),从大量数据中提取出有用知识的各种实用方法。 本书面向数据挖掘领域的研究人员、数据挖掘方向的研究生,以及数据挖掘工程师和分析师,对于学习数据挖掘课程的学生来说具有巨大的参考价值,对于参加数据挖掘与分析的行业培训课程的人来说是非常有用的资料。

内容提要

赵彦昌编著的《R语言与数据挖掘*佳实践和经 典案例》主要介绍如何使用R工具进行数据挖掘,提 供了R用于数据挖掘应用的案例、代码示例和数据, 涵盖了*常用的数据挖掘技术。 《R语言与数据挖掘*佳实践和经典案例》讲述 简洁、内容实用,配有现实应用案例和代码示例以及 数据,在线资源丰富,适合数据挖掘方向的研究生、 数据挖掘领域的研究人员,以及数据挖掘工程师和分 析师阅读。
    

作者简介

Yanchang Zhao从2009年起担任澳大利亚政府部门的**数据挖掘分析师。在加入澳大利亚政府部门之前,他是悉尼科技大学工程和信息技术学院博士后研究员。他的研究兴趣包括聚类分析、关联规则、时间序列、孤立点检测、数据挖掘应用等,当前关注在数据挖掘应用中使用R语言。他是IEEE**会员和澳大利亚分析专业人员协会成员。他发表了50多篇数据挖掘研究和应用方面的论文,并独立或与他人合作编写了3本著作。

目录

出版者的话
译者序
缩写词表
**章 简介
1.1 数据挖掘

1.3 数据集
1.3.1 iris数据集
1.3.2 bodyfat数据集
第2章 数据的导入与导出
2.1 R数据的保存与加载
2.2 .CSV文件的导入与导出
2.3 从SAS中导入数据
2.4 通过ODBC导入与导出数据
2.4.1 从数据库中读取数据
2.4.2 从Excel文件中导入与导出数据
第3章 数据探索
3.1 查看数据
3.2 探索单个变量
3.3 探索多个变量
3.4 *多探索
3.5 将图表保存到文件中
第4章 决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
第5章 回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
第6章 聚类
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类
第7章 离群点检测
7.1 单变量的离群点检测
7.2 局部离群点因子检测
7.3 用聚类方法进行离群点检测
7.4 时间序列数据的离群点检测
7.5 讨论
第8章 时间序列分析与挖掘
8.1 R中的时间序列数据
8.2 时间序列分解
8.3 时间序列预测
8.4 时间序列聚类
8.4.1 动态时间规整
8.4.2 合成控制图的时间序列数据
8.4.3 基于欧氏距离的层次聚类
8.4.4 基于DTW距离的层次聚类
8.5 时间序列分类
8.5.1 基于原始数据的分类
8.5.2 基于特征提取的分类
8.5.3 k-NN分类
8.6 讨论
8.7 延伸阅读
第9章 关联规则
9.1 关联规则的基本概念
9.2 Titanic数据集
9.3 关联规则挖掘
9.4 消除冗余
9.5 解释规则
9.6 关联规则的可视化
9.7 讨论与延伸阅读
**0章 文本挖掘
10.1 Twitter的文本检索
10.2 转换文本
10.3 提取词干
10.4 建立词项-文档矩阵
10.5 频繁词项与关联
10.6 词云
10.7 词项聚类
10.8 推文聚类
10.8.1 基于k-means算法的推文聚类
10.8.2 基于k-medoids算法的推文聚类
10.9 程序包、延伸阅读与讨论
**1章 社交网络分析
11.1 词项网络
11.2 推文网络
11.3 双模式网络
11.4 讨论与延伸阅读
**2章 案例Ⅰ:房价指数的分析与预测
12.1 HPI数据导入
12.2 HPI数据探索
12.3 HPI趋势与季节性成分
12.4 HPI预测
12.5 房地产估价
12.6 讨论
**3章 案例Ⅱ:客户回复预测与效益*大化
13.1 简介
13.2 KDD Cup 1998的数据
13.3 数据探索
13.4 训练决策树
13.5 模型评估
13.6 选择*优决策树
13.7 评分
13.8 讨论与总结
**4章 案例Ⅲ:内存受限的大数据预测模型
14.1 简介
14.2 研究方法
14.3 数据与变量
14.4 随机森林
14.5 内存问题
14.6 样本数据的训练模型
14.7 使用已选变量建立模型
14.8 评分
14.9 输出规则
14.9.1 以文本格式输出规则
14.9.2 输出SAS规则的得分
14.10 总结与讨论
**5章 在线资源
15.1 R参考文档
1
15.3 数据挖掘
15.4 R的数据挖掘
15.5 R的分类与预测
15.6 R的时间序列分析
15.7 R的关联规则挖掘
15.8 R的空间数据分析
15.9 R的文本挖掘
15.10 R的社交网络分析
15.11 R的数据清洗与转换
15.12 R的大数据与并行计算
R语言数据挖掘参考文档
参考资料
通用索引
包索引
函数索引