《Pandas数据分析》[48M]百度网盘|pdf下载|亲测有效
《Pandas数据分析》[48M]百度网盘|pdf下载|亲测有效

Pandas数据分析 pdf下载

出版社 清华大学出版社京东自营官方旗舰店
出版年 2023-06
页数 390页
装帧 精装
评分 8.7(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供Pandas数据分析电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

Pandas是强大且流行的库,是Python中数据科学的代名词。本书将向你介绍如何使用Pandas对真实世界的数据集进行数据分析,如股市数据、模拟黑客攻击的数据、天气趋势、地震数据、葡萄酒数据和天文数据等。Pandas使我们能够有效地处理表格数据,从而使数据整理和可视化变得更容易。

内容简介

  《Pandas数据分析》详细阐述了与Pandas数据分析相关的基本解决方案,主要包括数据分析导论、使用PandasDataFrame、使用Pandas进行数据整理、聚合Pandas DataFrame、使用Pandas和Matplotlib可视化数据、使用Seabom和自定义技术绘图、金融分析、基于规则的异常检测、Python机器学习入门、做出更好的预测、机器学习异常检测等内容。此外,该书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
  《Pandas数据分析》适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。

作者简介

  Stefanie Molin是纽约彭博有限合伙企业(Bloomberg LP)的数据科学家和软件工程师,负责解决信息安全方面的棘手问题,特别是围绕异常检测、构建数据收集工具和知识共享等方面的工作。她在数据科学、设计异常检测解决方案以及在广告技术(AdTech)和金融科技(FinTech)行业中利用R和Python的机器学习方面拥有丰富的经验。
  她拥有哥伦比亚大学傅氏基金工程和应用科学学院运筹学学士学位,辅修经济学、创业与创新。在闲暇时间,她喜欢环游世界、发明新食谱、学习人与计算机之间使用的新语言。

内页插图

目录

第1篇 Pandas入门
第1章 数据分析导论
1.1 章节材料
1.2 数据分析基础知识
1.2.1 数据收集
1.2.2 数据整理
1.2.3 探索性数据分析
1.2.4 得出结论
1.3 统计基础知识
1.3.1 采样
1.3.2 描述性统计
1.3.3 集中趋势的度量
1.3.4 均值
1.3.5 中位数
1.3.6 众数
1.3.7 数据散布的度量
1.3.8 全距
1.3.9 方差
1.3.10 标准差
1.3.11 变异系数
1.3.12 四分位距
1.3.13 四分位离散系数
1.3.14 汇总数据
1.3.15 常见分布
1.3.16 缩放数据
1.3.17 量化变量之间的关系
1.3.18 汇总统计的陷阱
1.3.19 预测
1.3.20 推论统计
1.4 设置虚拟环境
1.4.1 虚拟环境
1.4.2 使用venv
1.4.3 Windows中的操作
1.4.4 Linux/macOS中的操作
1.4.5 使用conda
1.4.6 安装所需的Python包
1.4.7 关于Pandas
1.4.8 Jupyter Notebook
1.4.9 启动JupyterLab
1.4.10 验证虚拟环境
1.4.11 关闭JupyterLab
1.5 小结
1.6 练习
1.7 延伸阅读
第2章 使用Pandas DataFrame
2.1 章节材料
2.2 Pandas数据结构
2.2.1 Series
2.2.2 Index
2.2.3 DataFrame
2.3 创建Pandas DataFrame
2.3.1 从Python对象中创建DataFrame
2.3.2 从文件中创建DataFrame
2.3.3 从数据库中创建DataFrame
2.3.4 从API中获取数据以创建DataFrame
2.4 检查DataFrame对象
2.4.1 检查数据
……
第2篇 使用Pandas进行数据分析
第3篇 使用Pandas进行实际应用分析
第4篇 scikit-learn和机器学习
第5篇 其他资源
附录A

前言/序言

  在信息时代,数据己成为人类社会一切经济活动和社会活动的基础。遍布社会各个触角的物联网,交投活跃的证券市场,蓬勃发展的电商物流,任何网友都可能成为互联网络的信息源,每时每刻都将产生数以亿计的数据。面对不断增长的大数据,如何将它们的价值提取出来,为科学决策提供事实参考,为正确预测提供信心支撑,这是数据分析和机器学习的关键任务,也是该行业发展的源动力。
  本书从实用性出发,通过两条线讨论了Python和Pandas操作。第一条线是数据分析的一般流程,即收集数据、数据整理、探索性数据分析、得出结论和数据可视化。在收集数据部分,介绍了各种数据集格式,以及通过API抓取数据等操作;在数据整理部分,介绍了Pandas数据结构、创建DataFrame、检查DataFrame对象、提取数据子集、添加和删除数据、数据清洗和转换、宽数据格式和长数据格式、处理缺失值、充实数据、处理时间序列数据等操作;在探索性数据分析部分,介绍了统计基础知识和聚合数据等操作;在数据可视化部分,介绍了Matplotlib、pandas.plotting和Seabom等操作。在这条线上,还提供了金融分析和基于规则的异常检测应用示例(这也是本书作者擅长的领域),如果你对炒股感兴趣,那么金融工具的技术分析(如支撑位和阻力位等指标)可能会给你带来一些启发。
  第二条线是机器学习工作流程,即拆分数据为训练集和测试集、预处理、构建模型、训练数据、在验证集上进行测试、在未见数据上评估模型。在这条线上,本书介绍了scikit-leam库,演示了如何在Python中轻松实现机器学习任务,包括聚类、分类和回归等;此外,本书还介绍了使用网格搜索调整超参数、特征工程、集成方法(包括Boosting、Bagging和Stacking)以及有监督学习和无监督学习等。
  在翻译本书的过程中,为了更好地帮助读者理解和学习,本书以中英文对照的形式保留了大量的原文术语。这样的安排不但方便读者理解书中的代码,而且也有助于读者通过网络查找和利用相关资源。
  本书由李强翻译。此外,黄进青也参与了部分内容的翻译工作。由于译者水平有限,