本篇主要提供精通数据科学算法计算机与互联网书籍电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
商品基本信息,请以下列介绍为准 | |
商品名称: | 精通数据科学算法 计算机与互联网 书籍 |
作者: | (英)戴维·纳蒂加(David Natingga)著 |
定价: | 59.0 |
出版社: | 人民邮电出版社 |
出版日期: | 2018-07-01 |
ISBN: | 9787115498168 |
印次: | |
版次: | 1 |
装帧: | 平装-胶订 |
开本: | 大32开 |
内容简介 | |
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。 本书讲解了7种重要的数据分析方法,它们分别是k邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。 本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。 |
目录 | |
第 1 章 用k邻算法解决分类问题 1.1 Mary对温度的感觉 1.2 实现k邻算法 1.3 意大利地区的示例——选择k值 1.4 房屋所有权——数据转换 1.5 文本分类——使用非欧几里德距离 1.6 文本分类——更高维度的k-NN 1.7 小结 1.8 习题 第 2 章 朴素贝叶斯 2.1 检查——贝叶斯定理的基本应用 2.2 贝叶斯定理的证明及其扩展 2.3 西洋棋游戏——独立事件 2.4 朴素贝叶斯分类器的实现 2.5 西洋棋游戏——相关事件 2.6 性别分类——基于连续随机变量的贝叶斯定理 2.7 小结 2.8 习题 第 3 章 决策树 3.1 游泳偏好——用决策树表示数据 3.2 信息论 044 3.3 ID3算法——构造决策树 047 3.4 用决策树进行分类 054 3.5 小结 060 3.6 习题 060 第 4 章 随机森林 064 4.1 随机森林算法概述 064 4.2 游泳偏好——随机森林分析法 065 4.3 随机森林算法的实现 071 4.4 下棋实例 075 4.5 购物分析——克服随机数据的不一致性以及 度量置信水平 082 4.6 小结 084 4.7 习题 084 第 5 章 k-means聚类 089 5.1 家庭收入——聚类为k个簇 089 5.2 性别分类——聚类分类 092 5.3 k-means聚类算法的实现 095 5.4 房产所有权示例——选择簇的数量 099 5.5 小结 105 5.6 习题 105 第 6 章 回归分析 114 6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114 6.2 根据身高预测体重——基于实际数据的线性回归 117 6.3 梯度下降算法及实现 118 6.4 根据距离预测飞行时长 122 6.5 弹道飞行分析——非线性模型 123 6.6 小 结 125 6.7 习 题 125 第 7 章 时间序列分析 130 7.1 商业利润——趋势分析 130 7.2 电子商店的销售额——季节性分析 132 7.3 小 结 140 7.4 习 题 140 附录 A 统计 145 A.1 基本概念 145 A.2 贝叶斯推理 146 A.3 分 布 146 A.4 交叉验证 147 A.5 A/B 测 试 148 附录 B R参考 149 B.1 介 绍 149 B.2 数据类型 150 B.3 线性回归 152 附录 C Python参考 154 C.1 介 绍 154 C.2 数据类型 155 C.3 控 制 流 159 附录 D 数据科学中的算法和方语 163 |
编辑 | |
机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实中复杂的数据问题,科学家们开发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何地进行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据进行预聚类,以便针对大型数据集进行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。 读完本书后,你将了解如何选择机器学习算法进行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 本书主要包括以下内容: 如何使用朴素贝叶斯、决策树和随机森林进行分类并准确地解决复杂问题; 正确识别数据科学问题并使用回归分析和时间序列分析设计合适的预测解决方案; 如何使用 k-means算法对数据进行聚类; 如何使用Python和R语言有效地实现算法。 |