单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级第7章 非结构化数据挖掘本章内容:7.1 Web数据挖掘7.2 空间群数据挖掘7.3 多媒体数据挖掘7.1 Web数据挖掘7.1.1 非结构化数据源Web数据挖掘的难点 对数据来源分析异构数据环境 半结构化的数据结构 解决半结构化的数据源问题 文本总结 XML与Web数据挖掘技术 XML的产生与发展 XML的主要特点 7.1
基于统计的方法基于距离的离群数据方法基于距离的离群数据定义 基于距离的离群数据挖掘的算法分类及算法描述 基于距离的算法的改进 基于偏离的离群数据挖掘序列离群数据技术 OLAP数据立方体技术
Slide TitleData warehouse is a subject oriented integratednon-volatile and time variant collection of data in support of managements decision —— [Inmon1996].Inmon把数据仓库描述为一个面向主题的完整的非易失的不同时间的用于支持决策管理的数据
E-MAIL:数据仓库与数据挖掘技术Electronicmerce夏火松E-MAIL: 数据仓库与数据挖掘技术教案第三部分 主要内容讲解第一章数据仓库与数据挖掘概述数据仓库引论1.1为什么要建立数据仓库什么是数据仓库数据仓库的特点7.4数据进入数据仓库的基本过程与建立数据仓库的步骤11.5
什么是数据仓库 数据仓库的特点 为什么要进行数据挖掘 1.数据挖掘的基本过程 (1)数据准备数据准备(data preparation):本阶段又可进一步细分成数据集成数据选择和预分析 (2) 挖掘挖掘(mining):DM处理器(data mining processor)综合利用前面提到的多种DM方法分析数据(3) 表述表述(presentation):与检验证型工具一样DM将获取的信息以便于
3九十年代互联网的出现与发展以及随之而来的企业内部网和企业外部网以及虚拟私有网的产生和应用使整个世界互联形成一个小小的地球村人们可以跨越时空地在网上交换信息和协同工作这样展现在人们面前的已不是局限于本部门本单位和本行业的庞大数据库而是浩瀚无垠的信息海洋392023如何才能不被信息淹没而是从中及时发现有用的知识提高信息利用率 数据的丰富带来了对强有力的数据分析工具的需求快速增长的海量数据存放在大型
☆ 数据仓库的数据模型结构1.星型模型 星型模型由一个事实表和维表组成事实表是星型模型的核心表包含两种类型的列第一种列是维度表的索引列这些列中存储了各维表的主键值它们组合成事实表的主键而其他非主属性的列则称为事实列其中包含了用于计算的信息即多维数据集中的度量值事实表中的每个事实指向每个维表中的一个元组2.雪花模型 雪花模型是对星型模型的一个扩展每个维表都可以向外连接多个维表雪花
#
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级数据挖掘与知识发现(复杂数据对象的数据挖掘与知识发现)3 数据仓库3 数据挖掘仓库 3.1数据库与数据仓库3.2数据仓库的操作3.3数据仓库的概念模型3.4数据立方体3.5数据仓库的结构3.6数据仓库的元数据 3.7数据仓库的建立 3.8数据仓库与数据挖掘省器材总省邮购局市内DDN各县邮购网点机房打印机配货部采购
第14章 数据仓库与数据挖掘 141数据仓库 142 OLAP 143 数据挖掘141 数据仓库数据管理要面向不同的管理人员需求构建不同类型的信息系统数据仓库的产生数据管理对于高层管理人员,主要是进行决策分析,所需要数据有以下几个方面的特征:面向主题:决策分析都是围绕一些主题而展开的集成的:决策分析所需数据将是多种异构数据源时变的:决策分析不但需要反映当前情况的数据,还需要历史数据非易失的:决策分
违法有害信息,请在下方选择原因提交举报