#
#
郑梦哲09统计一班 2009710051 数据挖掘摘要:随着网络数据库技术的迅速发展以及数据库管理系统的广泛应用人们积累的数据越来越多数据挖掘(Data Mining)就是从大量的实际应用数据中提取隐含信息和知识它利用了数据库人工智能和数理统计等多方面的技术是一类深层次的数据分析方法数据是知识的源泉但是拥有大量的数据与拥有许多有用的知识完全是两回事过去几年中从数据库中发现知识这一领域发展的很快广阔
4月8号交作业第二讲数据预处理习题:将下列属性分类成二元的离散的或连续的并将它们分类成定性的(标称的或序数的)或定量的(区间的或比率的)某些情况下可能有多种解释因此如果你认为存在二义性简略地给出你的理由例如:年龄回答:离散的定量的比率的a奥运会上授予的铜牌银牌和金牌b 衣服的尺寸大小c用每立方厘米克表示的物质密度d班级学生人数e教室的门牌号注:二元的离散的或连续的的分类与后者不同是根据值的个数来描
数据挖掘jxhanxa@主要内容1概述2数据仓库与OLAP技术3数据挖掘技术4数据挖掘应用数据挖掘工具6数据挖掘实例1概述11背景12数据挖掘定义13基本概念14主要功能15数据挖掘模型16实现流程17数据挖掘的应用18未来趋势11背景二十世纪末以来,全球信息量以惊人的速度急剧增长据估计,每二十个月将增加一倍。许多组织机构的IT系统中都收集了大量的数据(信息)。目前的数据库系统虽然可以高效地实现数
数据挖掘在航空CRM中的应用引言 运输业是国家经济的一个重要的组成部分其发展水平已经成为一个国家和地区综合实力的重要体现随着经济全球化我国对物流的需求将大幅度的增加物流将呈现跳跃式发展趋势企业开始改变那种以商品为导向的观念开始注重发掘通过收集整理繁多的信息量化分析需求提供优质的售后服务保持稳定的关系等措施来加强对客户关系的管理?CRM的主要含义就是通过对详细的深入分析
24簇间距离?AGNES算法层次聚类层次聚类14DIANA算法例题192123另一方面如果考虑链接数可以成功地把这些事务划分到恰当地簇中例如: 令θ=则C2中的事务 {abf}与{abg}的链接数是5 而C2中的事务 {abf}与C1中的事 务{abc}之间的链接数是3.因此ROCK能够正确地区分出两个不同 的事务簇变色龙算法的聚类步骤割边相对近似度(RC)谢谢
数据挖掘本贴来自《百岛论坛》斯坦佛大学统计系及线性加速中心摘要:DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科它强调对大量观测到的数据库的处理它是涉及数据库管理人工智能机器学习模式识别及数据可视化等学科的边缘学科用统计的观点看它可以看成是通过计算机对大量的复杂数据集的自动探索性分析目前对该学科的作用尽管有点夸大其词但该领域对商业工业及科学研究都有极大的影响且提供了大量的为促使新
#
#
违法有害信息,请在下方选择原因提交举报