《数据仓库与数据挖掘教程计算机与互联网》[87M]百度网盘|pdf下载|亲测有效
《数据仓库与数据挖掘教程计算机与互联网》[87M]百度网盘|pdf下载|亲测有效

数据仓库与数据挖掘教程计算机与互联网 pdf下载

出版社 国图书店图书专营店
出版年 2025
页数 390页
装帧 精装
评分 9.4(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供数据仓库与数据挖掘教程计算机与互联网电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

  商品基本信息,请以下列介绍为准
商品名称:数据仓库与数据挖掘教程(第2版)(高等院校信息管理与信息系统专业系列教材)
作者:
定价:49.0
出版社:
出版日期:1900-01-01
ISBN:9787302259138
印次:
版次:
装帧:
开本:

  内容简介

  数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。
  由于数据资源丰富,因此数据仓库与数据挖掘的决策支持。
  《数据仓库与数据挖掘教程(第2版)》系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、K-均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与Web挖掘。
  《数据仓库与数据挖掘教程(第2版)》从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。


  目录

第1章 数据仓库与数据挖掘概述
1.1 数据仓库的兴起
1.1.1 从数据库到数据仓库
1.1.2 从OLTP到OLAP
1.1.3 数据字典与元数据
1.1.4 数据仓库的定义与特点
1.2 数据挖掘的兴起
1.2.1 从机器学据挖掘
1.2.2 数据挖掘含义
1.2.3 数据挖掘与OLAP的比较
1.2.4 数据挖掘与统计学
1.3 数据仓库和数据挖掘的结合
1.3.1 数据仓库和数据挖掘的区别与联系
1.3.2 基于数据仓库的决策支持系统
1.3.3 数据仓库与商业智能


第2章 数据仓库原理
2.1 数据仓库结构体系
2.1.1 数据仓库结构
2.1.2 数据集市及其结构
2.1.3 数据仓库系统结构
2.1.4 数据仓库的运行结构
2.2 数据仓库数据模型
2.2.1 星型模型
2.2.2 雪花模型
2.2.3 星网模型
2.2.4 第三范式
2.3 数据抽取、转换和装载
2.3.1 数据抽取
2.3.2 数据转换
2.3.3 数据装载
2.3.4 ETL工具
2.4 元数据
2.4.1 元数据的重要性
2.4.2 关于数据源的元数据
2.4.3 关于数据模型的元数据
2.4.4 关于数据仓库映射的元数据
2.4.5 关于数据仓库使用的元数据


第3章 联机分析处理
3.1 OLAP概念
3.1.1 OLAP的定义
3.1.2 OLAP准则
3.1.3 OLAP的基本概念
3.2 OLAP的数据模型
3.2.1 MOLAP数据模型
3.2.2 ROLAP数据模型
3.2.3 MOLAP与ROLAP的比较
3.2.4 HOLAP数据模型
3.3 多维数据的显示
3.3.1 多维数据显示方法
3.3.2 多维类型结构
3.3.3 多维数据的分析视图
3.4 0ALP的多维数据分析
3.4.1 多维数据分析的基本操作
3.4.2 多维数据分析实例
3.4.3 广义OL能
3.4.4 数据立方体
3.4.5 多维数据分析的MDX语言及其应用

……

第4章 数据仓库设计与开发
第5章 数据仓库的决策支持
第6章 数据挖掘原理
第7章 信息论方法
第8章 集合论方法
第9章 神经网络
第10章 遗传算法化计算
第11章 公式发现
第12章 知识挖掘
第13章 文本挖掘与Web挖掘

参考文献


  前言

  数据仓库(Data Warehouse,DW)和数据挖掘(Data Mining,DM)是决策支持的两项重要技术。在数据仓库中利用多维数据分析来发现问题,并找出产生的原因,能从大量历史数据中预测未来;利用数据挖掘方法能从大量数据中获取知识。两项技术的共同特点是都需要利用大量的数据资源。
  数据仓库和数据挖掘是在20世纪90年代中期兴起的,经过十多年的发展,在技术和应用两个方面都得到了很大的提高。为了提高数据仓库的决策支持效果年来开展了对综合数据的数据立方体的压缩技术研究,以及对多维数据分析的MDX语言的推广。本书第2版增加了这两项内容。为了强化数据挖掘中神经网络与遗传算法两项实用技术,在第2版中把它们独立列为两章。在神经网络中,按从易到难的顺序将内容重新安排了一下,并增加了径向基函数网络RBF的内容。在遗传算法中增加化计算的内容,以便扩大读者的视野。
  本书仍保留了按数据仓库的形成过程来讲述其内容的方式,即从数据库到数据仓库以及对比,从联机事务处理OLTP到联机分析处理OLAP以及对比,用它们的对比来突出数据仓库决策支持的作用。按形成过程来讲述,既有利于掌握它们的连贯性,又有利于掌握数据仓库的新特点。
  本书保留了依照数据挖掘的理论基础来讲述数据挖掘的方法:大家熟悉的决策树方法实质上是利用信息论中计算信息量的公式来选择属性构造决策树的结点;影响较大的粗糙集方法是典型的利用集合的覆盖原理;关联规则挖掘方法是对相关事务(项)的子集占整个集合的比例,大于阈值时建立关联规则的;在集合论方法中增加了影响大的K-均值聚类方法。读者在懂得数据挖掘的方基础后,能够更好地掌握和使用这些方法。
  本书第12章由原来的第12章的“数据仓库与数据挖掘的发展”变为“知识挖掘”,这一章是的内容。第13章做了部分修改,增加了“Web日志分析与实例”一节。
  作者从事数据仓库与数据挖掘研究工作多年,在本书第12章中介绍了作者完成的项目——“软化规律的知识挖掘”,相信能对本科作用。掌握这些软化规律,一来能够帮助学员提高软件使用能力;二来能够引起他们的兴趣,一步去挖掘软化规律,软化。本书中也介绍了作的团队完成的项目:IBLE决策规则树方法、FDD公式发现系统、遗传分类学GCLS、变换规则的知识挖掘等。这些内容并不要求本科生掌握,关键在于启发他们如何去创新。这些内容更适合研究生学关行业的工作人员参考。