数据挖掘概念与技术第二章数据预处理总结 描述性数据汇总 对于成功的数据预处理获得数据的总体印象是至关重要描述性数据汇总技术可以用来识别数据的典型性质突显哪些数据值应当视为噪声或离群点对于许多数据预处理任务用户希望知道关于数据中心趋势和离中心趋势特征中心趋势度量包括均值(mean)中位数(median)众数(mode)和中列数(midrange)而数据离中趋势度量包括四分位数(quartil
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级数据挖掘:概念与技术Jiawei Han and Micheline Kamber著Monrgan Kaufmann Publishers Inc.范明 孟小峰等译机械工业出版社1教师: 杨昆办
数 据 挖 掘——概念与技术王腾蛟北京大学计算机科学技术系数据库与信息系统研究室Tel: 010 62765823 Email: tjwangpku.eduCell Phone: 13661105863引言数据挖掘的概念与分类体系数据挖掘的原理与方法数据挖掘的相关国际标准数据挖掘系统结构数据挖掘系统设计中的若干问题数据挖掘新技术主要内容大批成熟的业务信息系统投入运行信息系统多年运
Click to edit Master title styleClick to edit Master text stylesSecond levelThird levelFourth levelFifth levelData Mining: Concepts and TechniquesData Mining: Concepts and Techniques — Slides for Text
Slide TitleData warehouse is a subject oriented integratednon-volatile and time variant collection of data in support of managements decision —— [Inmon1996].Inmon把数据仓库描述为一个面向主题的完整的非易失的不同时间的用于支持决策管理的数据
概述数据仓库联机分析处理数据仓库的设计数据预处理 维度建模数据挖掘聚类关联规则 分类覆盖企业内部信息合作伙伴信息和市场信息覆盖综合信息和明细信息覆盖当前数据和历史数据高可用性高质量的数据(一致性完整性)支持各种不同的分析方法数据定义符合业务人员要求综合的或提炼的处理需求事先不知道访问很少或不多蜘蛛网问题第一章数据仓库基本概念消除冲突:不一致同名异义异名同义单位不统一等等需要进行数据清理(因为来源于
一则广为流传的案例:啤酒和尿布的故事数据挖掘的步骤数据库一般功能描述性的数据挖掘 预测性的数据挖掘通常用户并不知道在数据中能挖掘出什么东西对此我们会在数据挖掘中应用一些常用的数据挖掘功能挖掘出一些常用的模式包括:概念类描述: 特性化和区分(定性与对比) 关联分析分类和预测 聚类分析孤立点分析趋势和演变分析新增加ClassificationAlgorithmsTenured<=30决策树实例孤立点
Click to edit Master title styleClick to edit Master text stylesSecond levelThird levelFourth levelFifth level数据挖掘:概念与技术数据挖掘: 概念与技术 — 第二章 数据预处理 —2022441数据挖掘:概念与技术第二章: 数据预处理为什么需要数据预处理描述性数据汇总数据清理 数据集成和变
#
Click to edit Master title styleClick to edit Master text stylesSecond levelThird levelFourth levelFifth levelData Mining: Concepts and TechniquesData Mining: Concepts and Techniques — Chapter 2 —Jia
违法有害信息,请在下方选择原因提交举报