#
数据挖掘jxhanxa@主要内容1概述2数据仓库与OLAP技术3数据挖掘技术4数据挖掘应用数据挖掘工具6数据挖掘实例1概述11背景12数据挖掘定义13基本概念14主要功能15数据挖掘模型16实现流程17数据挖掘的应用18未来趋势11背景二十世纪末以来,全球信息量以惊人的速度急剧增长据估计,每二十个月将增加一倍。许多组织机构的IT系统中都收集了大量的数据(信息)。目前的数据库系统虽然可以高效地实现数
曹达 23220101153239一分析题1. 如何改进kmeans算法中的k的选取问题聚类数的确定没有个确切方法K值可以先用系统聚类法看谱系图然后得出大致分几类然后试多几个k值确定个最好的使用遗传算法是解决K均值中K的选取一个比较可行的方法K均值聚类算法把n个向量Xj(j = 12…n)分成K 个类 (k= 12…k)每类的所有样本形成一组求每组的聚类中心使得非相似性(或距离)指标的价值函数(或
:
一辨析题1.什么是过拟合什么是泛化性分析两者的联系和区别(10 5)<20102011>答:过拟合:为了得到一致假设而使假设变得过度复杂称为过拟合即使用过多的主成分建立模型降低了预测能力泛化性:经过训练的网络(有限样本)对于不是 HYPERLINK =e6a0b7e69cace99b86 样本集的输入(其他变量域)的预测能力也指 HYPERLINK =e7a59ee7bb8fe7b
数据挖掘本贴来自《百岛论坛》斯坦佛大学统计系及线性加速中心摘要:DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科它强调对大量观测到的数据库的处理它是涉及数据库管理人工智能机器学习模式识别及数据可视化等学科的边缘学科用统计的观点看它可以看成是通过计算机对大量的复杂数据集的自动探索性分析目前对该学科的作用尽管有点夸大其词但该领域对商业工业及科学研究都有极大的影响且提供了大量的为促使新
#
#
数据仓库与数据挖掘考试试卷要求:在D盘下建立以自己-命名的文件夹如在要求1中所建立的文件夹下建立以下文件夹:OLAP ETL REPORTSOLAP设计与应用请建立多维数据集以分析在线销售的数据要求如下:建立分析服务项目并将项目的所有保存在OLAP文件夹中数据源为Adventure Works DW数据库建立的多维数据集名称为Fact Internet Sales度量值组名为Int
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级??单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级2012-5-24??单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级2012-5-24??单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级2012-5-24??单击此处编辑母版标题样式单击此处编辑母版文
违法有害信息,请在下方选择原因提交举报