单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级第6章现代数据挖掘技术与发展 本章学习目标:(1) 通过知识挖掘系统的体系结构的学习掌握知识发现的定义和知识发现系统的结构 (2) 通过现代挖掘技术及应用的学习掌握规则型神经网络型遗传算法型粗糙集型和决策树型现代挖掘技术(3) 通过知识发现工具与应用的学习掌握知识挖掘工具的系统结构运用中的问题和知识挖掘的价值(4) 经过数据挖
Slide TitleData warehouse is a subject oriented integratednon-volatile and time variant collection of data in support of managements decision —— [Inmon1996].Inmon把数据仓库描述为一个面向主题的完整的非易失的不同时间的用于支持决策管理的数据
基于统计的方法基于距离的离群数据方法基于距离的离群数据定义 基于距离的离群数据挖掘的算法分类及算法描述 基于距离的算法的改进 基于偏离的离群数据挖掘序列离群数据技术 OLAP数据立方体技术
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级数据仓库与数据挖掘技术第6章 数据预处理技术主讲人:孙水华 副教授信息科学与工程学院目 录数据预处理概述 数据清理 数据集成数据变换 数据归约 小 结 数据预处理(data preprocessing)是指在对数据进行数据挖掘主要的处理以前先对原始数据进行必要的清洗集成转换离散和归约等等一系列的处理工作以达
1579111315
知识发现的研究问题知识发现系统的结构知识发现管理器知识发现引擎知识库数据仓库的数据库接口知识发现系统的数据库接口可以直接与数据仓库通信知识发现评价数据库接口商业分析员知识发现描述计算机磁带和磁盘联机分析处理(OLAP)多维数据库数据仓库数据挖掘的进化历程数据挖掘的范围数据挖掘的任务时序模式分类关联分析时序模式聚类分类偏差检测预测数据挖掘的进化历程数据挖掘的任务数据挖掘的分类数据挖掘的对象数据挖掘与
分类概述Classifier(Model)预测的正确性时间构建模型的时间使用模型所需的时间健壮性处理噪声及缺失值的能力可扩展性可操作性规则的优化决策树的大小分类规则的简洁性数据仓库与数据挖掘数据仓库与数据挖掘良良良优良优良决策树表示与例子4150决策树生成算法描述 决策树算法剪枝技术是一种克服噪声的技术同时它也能使树得到简化而变得更容易理解剪枝的类型向前剪枝(forward pruning)在生
什么是数据仓库 数据仓库的特点 为什么要进行数据挖掘 1.数据挖掘的基本过程 (1)数据准备数据准备(data preparation):本阶段又可进一步细分成数据集成数据选择和预分析 (2) 挖掘挖掘(mining):DM处理器(data mining processor)综合利用前面提到的多种DM方法分析数据(3) 表述表述(presentation):与检验证型工具一样DM将获取的信息以便于
3九十年代互联网的出现与发展以及随之而来的企业内部网和企业外部网以及虚拟私有网的产生和应用使整个世界互联形成一个小小的地球村人们可以跨越时空地在网上交换信息和协同工作这样展现在人们面前的已不是局限于本部门本单位和本行业的庞大数据库而是浩瀚无垠的信息海洋392023如何才能不被信息淹没而是从中及时发现有用的知识提高信息利用率 数据的丰富带来了对强有力的数据分析工具的需求快速增长的海量数据存放在大型
第六章 数据挖掘的基本算法分类是指把数据样本映射到一个事先定义的类中的学习过程即给定一组输入的属性向量及其对应的类用基于归纳的学习算法得出分类 主要目的是分析输入数据通过在训练集中的数据表现出来的特性为每一类找到一种准确的描述或模型 数据分类过程主要包含两个步骤 学习建模 分类测试例如:给定一个顾客信用信息数据库通过学习所获得的分类规则可用于识别顾客是否是具有良好的信用等级或一般的信用等级分类测
违法有害信息,请在下方选择原因提交举报