单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级第四讲数据仓库数据库与数据仓库数据不一致可频繁删除数据存放短期数据(3个月内)存在数据冗余数据仓库概述数据仓库与CRM有着难以割舍的密切关系客户关系管理的很多工作都是以数据仓库为基础展开的利用数据仓库企业可以对客户行为进行分析和预测从而制定准确的市场策略发
数据仓库的特点面向主题主题是在较高层次上对数据抽象面向主题的数据组织分为两步骤抽取主题确定每个主题所包含的数据内容每个主题在数据仓库中都是由一组关系表实现的集成的数据不可更改随时间变化的过去详细数据数据仓库中的数据组织形式简单堆积与轮转综合的比较ProdSales<pkfk><pk>districtAttributes of the time dimension数据仓库系统的工具层查询工具主要是对
Click to edit Master text styles Second Level Third LevelFifth LevelFourth Level《管理信息系统》 2版Click to edit Master title style第 页Click to edit Master text styles Second Level Third LevelFifth LevelFourt
#
数据DW数据集市数据仓库设计理论Dw开发模型顾客号星型事实表OLAP是一项软件技术-〉分析Cube--〉专业工具支持分析Cube平面文件SSISSSASSSRS
Click to edit Master title styleClick to edit Master text stylesSecond levelThird levelFourth levelFifth levelTeradata数据仓库Dr. Zhang JianSenior Technical ConsultantTD China Apr. 2009介绍NCR介绍创建于1884年
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级第三章 操作数据存储(ODS)3.1 ODS基本概念3.2 DB-ODS-DW体系结构3.3 创建ODS第三章 操作数据存储(ODS) DW概念的提出不但为有效地支持企业经营管理决策提供了一个全局一致的数据环境也为历史数据综合数据的处理提出了一种行之有效的解决方法使得企业的数据环境从单一的数据
知识发现过程模式KDD过程数据库的特点有:(1)数据动态性(2)数据不完全性(3)数据噪声(4)数据冗余性(5)数据稀疏性(6)海量数据若两个或多个数据项的取值之间重复出现且概率很高时它就存在某种关联可以建立起这些数据项的关联规则例如买面包的顾客有90的人还买牛奶这是一条关联规则一般用支持度和可信度两个阈值来淘汰那些无用的关联规则预测是利用历史数据找出变化规律建立模型并用此模型来预测未来数据的种类
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级数据仓库与数据挖掘 北京科技大学 武 森 数据仓库(Data Warehouse)北京科技大学 武 森内容安排1 数据仓库概
The Apriori AlgorithmCk: Candidate itemset of size kLk : frequent itemset of size k2002Sup.{1 2}{1 3}C1{2 5}Itmeset2最后得到的频繁项集是:L1 ? L2 ? L3即:{ {1}{2}{3}{5}{1 3}{2 3}{2 5}{3 5}{2 3 5} } 分类分析 数据挖掘的步骤
违法有害信息,请在下方选择原因提交举报