本篇主要提供轻松学大数据挖掘:算法、场景与数据产品汪榕著电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
图书基本信息 | |
图书名称 | 轻松学大数据挖掘:算法、场景与数据产品 |
作者 | 汪榕 著 |
定价 | 59元 |
出版社 | 电子工业出版社 |
ISBN | 9787121329265 |
出版日期 | 2018-01-01 |
字数 | 230 |
页码 | 198 |
版次 | |
装帧 | 平装 |
开本 | 16开 |
商品重量 |
内容提要 | |
伴随着大数据时代的发展,数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程,打破以往的数据工具与技术的介绍模式,凭借作者在大数据价值探索过程中的所感所悟,以故事的形式和读者分享一个又一个的数据经历,引人深思、耐人寻味。全书共9章,~2章介绍数据情怀与数据入门;第3~6章讨论大数据挖掘相关的一系列学习体系;第7~9章为实践应用与数据产品的介绍。让所有学习大数据挖掘的朋友清楚如何落地,以及在整个数据生态圈所需要扮演的角色,全面了解数据的上下游。 n |
目录 | |
目 录 n章数据情怀篇 n1.1 数据之禅 n1.2 数据情怀 n1.2.1 数据情怀这股劲 n1.2.2 对数据情怀的理解 n1.3 大数据时代的我们 n1.4 成为DT时代的先驱者 n1.4.1 数据没有寒冬 n1.4.2 数据生态问题 n1.4.3 健康的数据生态 n1.4.4 结尾 n第2章数据入门 n2.1 快速掌握SQL的基础语法 n2.1.1 初识SQL n2.1.2 学会部署环境 n2.1.3 常用的SQL语法(上篇) n2.1.4 常用的SQL语法(下篇) n2.2 在Windows 7操作系统上搭建IPythoNotebook n2.2.1 学习Python的初衷 n2.2.2 搭建IPythoNotebook n2.2.3 IPython.exe Notebook的使用说明 n2.2.4 配置IPythoNotebook远程调用 n2.3 快速掌握Python的基本语法 n2.4 用Python搭建数据分析体系 n2.4.1 构建的初衷 n2.4.2 构建思路 n2.4.3 开发流程 n2.5 Python学习总结 n2.5.1 关于Python n2.5.2 Python其他知识点 n第3章大数据工具篇 n3.1 Hadoop伪分布式的安装配置 n3.1.1 部署CentOS环境 n3.1.2 部署Java环境 n3.1.3 部署Hadoop伪分布式环境 n3.2 数据挖掘中的MapReduce编程 n3.2.1 学习MapReduce编程的目的 n3.2.2 MapReduce的代码规范 n3.2.3 简单的案例 n3.3 利用MapReduce中的矩阵相乘 n3.3.1 矩阵的概念 n3.3.2 不同场景下的矩阵相乘 n3.4 数据挖掘中的Hive技巧 n3.4.1 面试心得 n3.4.2 用Python执行HQL命令 n3.4.3 必知的HQL知识 n3.5 数据挖掘中的HBase技巧 n3.5.1 知晓相关依赖包 n3.5.2 从HBase中获取数据 n3.5.3 往HBase中存储数据 n第4章大数据挖掘基础篇 n4.1 MapReduce和Spark做大数据挖掘的差异 n4.1.1 初识Hadoop生态系统 n4.1.2 知晓Spark的特点 n4.1.3 编程的差异性 n4.1.4 它们之间的灵活转换 n4.1.5 选择合适的工具 n4.2 搭建大数据挖掘开发环境 n4.3 动手实现算法工程 n4.3.1 知晓Spark OYarn的运作模式 n4.3.2 创作个数据挖掘算法 n4.3.3 如何理解“朴素”二字 n4.3.4 如何动手实现朴素贝叶斯算法 n第5章大数据挖掘认知篇 n5.1 理论与实践的差异 n5.2 数据挖掘中的数据清洗 n5.2.1 数据清洗的那些事 n5.2.2 大数据的必杀技 n5.2.3 实践中的数据清洗 n5.3 数据挖掘中的工具包 n5.3.1 业务模型是何物 n5.3.2 想做一个好的模型 n第6章大数据挖掘算法篇 n6.1 时间衰变算法 n6.1.1 何为时间衰变 n6.1.2 如何理解兴趣和偏好 n6.1.3 时间衰变算法的抽象 n6.1.4 采用Spark实现模型 n6.2 熵值法 n6.2.1 何为信息熵 n6.2.2 熵值法的实现过程 n6.2.3 业务场景的介绍 n6.2.4 算法逻辑的抽象 n6.3 预测响应算法 n6.3.1 业务场景的介绍 n6.3.2 构建模型的前期工作 n6.3.3 常用的预测模型 n6.4 层次分析算法 n6.5 工程能力的培养与实践 n6.5.1 工程能力的重要性 n6.5.2 利用Python实现层次分析法 n第7章用户画像实践 n7.1 用户画像的应用场景 n7.1.1 背景描述 n7.1.2 需求调研 n7.2 用户画像的标签体系 n7.2.1 需求分析 n7.2.2 标签的构建 n7.3 用户画像的模块化思维 n7.3.1 何为模块化思维 n7.3.2 用户画像与模块化思维 n7.4 用户画像的工程开发 n7.4.1 对于开发框架的选择 n7.4.2 模块化功能的设计 n7.5 用户画像的智能营销 n7.5.1 业务营销 n7.5.2 营销构思 n7.5.3 技术难点 n第8章反欺诈实践篇 n8.1 “羊毛党”监控的业务 n8.1.1 “羊毛党”的定义与特点 n8.1.2 “羊毛”存在的必然性 n8.1.3 “羊毛党”的进化 n8.1.4 “羊毛党”存在的利与弊 n8.1.5 “羊毛党”监控平台的意义 n8.2 “羊毛党”监控的设备指纹 n8.2.1 何为设备指纹 n8.2.2 底层参数 n8.2.3 应用场景 n8.2.4 移动端的数据持久化 n8.2.5 设备指纹生成算法 n8.3 “羊毛党”监控的数据驱动 n8.3.1 监控的目的 n8.3.2 数据如何“食用” n8.4 “羊毛党”监控的实践分享 n第9章大数据挖掘践行篇 n9.1 如何从0到1转型到大数据圈子 n9.2 数据挖掘从业者综合能力评估 n9.2.1 度量的初衷 n9.2.2 综合能力评估 n9.2.3 个人指标体系(大数据挖掘) n9.3 给想要进入数据挖掘圈子的新人一点建议 n9.3.1 诚信与包装 n9.3.2 筹备能力 n9.3.3 投好简历 n9.3.4 把握面试 n9.3.5 结尾 n后记数据价值探索与数据产品实践 nn |
作者介绍 | |
汪榕(@乐平汪二),一个充满大数据情怀的程序员,致力于分享自己的所感所悟,为数据生态圈的健康发展贡献自己一份力量。拥有6年的业务建模经验,曾率队夺得全国大学生数据建模一等奖,并代表重庆高校队伍与全国名校一起参与深圳夏令营建模比赛。 n目前从事互联网金融行业,专注于大数据挖掘与数据产品。同时也是大数据挖掘杂谈社区的创建人,汇集了全球各地的数据爱好者,共同探索数据的价值。 n |
编辑推荐 | |
适读人群 :可作为相关工作经验在3年以内的数据挖掘工程师、转型入门做大数据挖掘的人士或者对数据感兴趣的追逐者的轻松学习教程,引导大家有一个正确的学习方向,也可供对数据产品感兴趣的产品经理和数据挖掘工程师阅读参考。 不依赖工具包,结合场景个性化构建业务模型 n有数据情怀,更有深刻认知 n是数据圈的一股清流,是初学者的入门指南, n也是传统挖掘者的进阶之路 n |