大型实时数据库在线数据挖掘技术研究 xuebao.nuc.edu:余立建所在单位:(西南交通大学 计算机与通信工程学院 四川 成都测试技术学报 2005第2期摘 要: 在分析测控系统实时数据库数据量和结构的基础上 提出了两次读取(粗读 细读)实时数据库的方法 提高了实时数据库在线分析的速度 并给出了程序流程图 采用时域能量与频域能量谱函数相同的理论在线快速查找相似的时间子序列
E-MAIL:数据仓库与数据挖掘技术Electronicmerce夏火松E-MAIL: 数据仓库与数据挖掘技术教案第三部分 主要内容讲解第一章数据仓库与数据挖掘概述数据仓库引论1.1为什么要建立数据仓库什么是数据仓库数据仓库的特点7.4数据进入数据仓库的基本过程与建立数据仓库的步骤11.5
#
Slide TitleData warehouse is a subject oriented integratednon-volatile and time variant collection of data in support of managements decision —— [Inmon1996].Inmon把数据仓库描述为一个面向主题的完整的非易失的不同时间的用于支持决策管理的数据
#
基于统计的方法基于距离的离群数据方法基于距离的离群数据定义 基于距离的离群数据挖掘的算法分类及算法描述 基于距离的算法的改进 基于偏离的离群数据挖掘序列离群数据技术 OLAP数据立方体技术
#
概述数据仓库联机分析处理数据仓库的设计数据预处理 维度建模数据挖掘聚类关联规则 分类覆盖企业内部信息合作伙伴信息和市场信息覆盖综合信息和明细信息覆盖当前数据和历史数据高可用性高质量的数据(一致性完整性)支持各种不同的分析方法数据定义符合业务人员要求综合的或提炼的处理需求事先不知道访问很少或不多蜘蛛网问题第一章数据仓库基本概念消除冲突:不一致同名异义异名同义单位不统一等等需要进行数据清理(因为来源于
一则广为流传的案例:啤酒和尿布的故事数据挖掘的步骤数据库一般功能描述性的数据挖掘 预测性的数据挖掘通常用户并不知道在数据中能挖掘出什么东西对此我们会在数据挖掘中应用一些常用的数据挖掘功能挖掘出一些常用的模式包括:概念类描述: 特性化和区分(定性与对比) 关联分析分类和预测 聚类分析孤立点分析趋势和演变分析新增加ClassificationAlgorithmsTenured<=30决策树实例孤立点
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级第7章 非结构化数据挖掘本章内容:7.1 Web数据挖掘7.2 空间群数据挖掘7.3 多媒体数据挖掘7.1 Web数据挖掘7.1.1 非结构化数据源Web数据挖掘的难点 对数据来源分析异构数据环境 半结构化的数据结构 解决半结构化的数据源问题 文本总结 XML与Web数据挖掘技术 XML的产生与发展 XML的主要特点 7.1
违法有害信息,请在下方选择原因提交举报