本篇主要提供R语言与数据挖掘张良均谢佳标杨坦肖刚大数据技术丛书电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
商品基本信息 | |
商品名称: | R语言与数据挖掘 |
作者: | 张良均 谢佳标 杨坦 肖刚 |
市场价: | 59.00 |
ISBN号: | 9787111540526 |
版次: | 1-3 |
出版日期: | 2016-06 |
页数: | 302 |
字数: | 187 |
出版社: | 机械工业出版社 |
内容简介 | |
本书主要分为三个部分,基础篇、建模应用篇和Rattle篇。基础篇(*1~5章)介绍了有关R语言的安装与使用、R语言中的数据结构、常用操作和绘图功能等基础功能。建模应用篇(第6~10章)主要介绍了目前在数据挖掘中的常用的建模方法在R语言中的实现函数,并对输出结果进行了解释,有助于读者快速掌握应用R语言进行分析挖掘建模的方法。Rattle篇(*11章)介绍了一个R语言的图形界面工具。图书配套提供了程序代码及数据,读者可通过上机实验,快速掌握书中所介绍的R语言的使用方法。 |
目录 | |
Contents?目 录 前 言 *一部分 基础篇 *1章 R语言的安装与使用 2 1.1 R安装与升级 3 1.2 R使用入门 4 1.2.1 R操作界面 4 1.2.2 RStudio窗口介绍 5 1.2.3 R常用操作 6 1.3 R数据分析包 8 1.4 配套资源使用说明 10 1.5 小结 10 1.6 上机实验 10 *2章 数据对象与数据读写 12 2.1 数据类型 12 2.2 数据结构 16 2.2.1 向量 16 2.2.2 矩阵 19 2.2.3 数组 24 2.2.4 数据框 25 2.2.5 因子 28 2.2.6 列表 31 2.3 数据文件的读写 34 2.3.1 键盘输入数据 34 2.3.2 读取不同格式的数据 35 2.3.3 从其他统计软件获取数据 37 2.3.4 从数据库获取数据 37 2.3.5 从wangye获取数据 39 2.4 小结 40 2.5 上机实验 40 第3章 R语言常用数据管理 42 3.1 变量的重命名 42 3.2 缺失值分析 45 3.3 数据排序 46 3.4 随机抽样 48 3.5 数值运算函数 49 3.6 字符串处理 52 3.7 文本分词 56 3.8 apply函数族 62 3.9 数据整合 65 3.10 控制流 68 3.11 函数的编写 71 3.12 小结 72 3.13 上机实验 73 第4章 图形探索 75 4.1 图形元素 76 4.1.1 颜色 76 4.1.2 点 80 4.1.3 文本 82 4.1.4 线条 86 4.1.5 图例 91 4.1.6 坐标轴 92 4.2 图形组合 94 4.3 图形保存 97 4.4 图形函数 98 4.5 小结 116 4.6 上机实验 116 第5章 *级绘图工具 117 5.1 lattice包绘图工具 117 5.1.1 绘图特色 117 5.1.2 基本图形 122 5.2 ggplot2包绘图工具 135 5.2.1 从qplot开始 135 5.2.2 ggplot作图 137 5.3 交互式绘图工具简介 142 5.3.1 rCharts包 143 5.3.2 recharts包 147 5.3.3 googleVis包 147 5.3.4 htmlwidgets包 148 5.3.5 shiny包 153 5.4 小结 163 5.5 上机实验 163 *二部分 建模应用篇 第6章 分类与预测 166 6.1 回归分析 166 6.2 决策树 175 6.2.1 C4.5算法 176 6.2.2 CART算法 178 6.2.3 C5.0算法 180 6.3 人工神经网络 181 6.4 KNN算法 183 6.5 朴素贝叶斯分类 185 6.6 其他分类与预测算法函数 187 6.7 分类与预测算法评价 192 6.8 小结 196 6.9 上机实验 196 第7章 聚类分析 198 7.1 K-Means聚类分析函数 199 7.2 层次聚类算法 204 7.3 其他聚类分析函数 207 7.4 小结 211 7.5 上机实验 212 第8章 关联规则 213 8.1 Apriori关联规则 214 8.2 小结 226 8.3 上机实验 226 第9章 智能推荐 228 9.1 智能推荐模型构建 228 9.2 智能推荐模型评价 232 9.3 小结 235 9.4 上机实验 235 *10章 时间序列 237 10.1 ARIMA模型 237 10.2 其他时间序列模型 245 10.3 小结 250 10.4 上机实验 251 第三部分 Rattle篇 *11章 可视化数据挖掘工具Rattle 254 11.1 Rattle简介及其安装 254 11.1.1 Rattle简介 254 11.1.2 Rattle安装 254 11.2 功能预览 255 11.3 数据导入 256 11.3.1 导入CSV数据 256 11.3.2 导入ARFF数据 261 11.3.3 导入ODBC数据 262 11.3.4 R Dataset——导入其他数据源 264 11.3.5 导入RData File数据集 267 11.3.6 导入Library数据 268 11.4 数据探索 269 11.4.1 数据总体概况 269 11.4.2 数据分布探索 272 11.4.3 相关性 275 11.4.4 主成分 277 11.4.5 交互图 278 11.5 数据建模 283 11.5.1 聚类分析 283 11.5.2 关联规则 288 11.5.3 决策树 291 11.5.4 随机森林 293 11.6 模型评估 296 11.6.1 混淆矩阵 296 11.6.2 风险图 296 11.6.3 ROC图及相关图表 297 11.6.4 模型得分数据集 298 11.7 小结 299 11.8 上机实验 299 参考资料 301 |