关联规则算法实验 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代在最近十几年里数据库中存储的数据急剧增大例如NASA轨道卫星上的地球观测系统EOS每小时会向地面发回50GB的图像数据世界上最大的数据仓库之一美国零售商系统Wal-Mart每天会产生2亿左右的交易数据人类基因组数据库项目已经搜集了数以GB计的人类基因编码数据大型天文望远镜每年会产生不少于10TB的数据等等大量的信
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级关联规则简介关联规则(Association Rules)反映一个事物与其他事物之间的相互依存性和关联性如果两个或者多个事物之间存在一定的关联关系那么其中一个事物就能够通过其他事物预测到首先被Agrawal Imielinski and Swami在199
package winimport java.io.BufferedReader import java.io.File import java.io.FileNotFoundException import java.io.FileReader import java.io.IOException import java.util.ArrayList import
#
关联规则挖掘数据挖掘(Data Mining)就是从大量的不完全的有噪声的模糊的随机的实际应用数据中提取隐含在其中的人们事先不知道的但又是潜在有用的信息和知识的过程1什么是关联规则挖掘关联规则挖掘也称为购物篮分析(market basket analysis)研究属性间的相关性所有的关联规则用形如if—then的形式来提供从数据仓库的数据中挖掘得到并且与逻辑的if—then规则不同关联规则本
#
是项的集合给定一个交易数据库D其中每个事务(Transaction)t是I的非空子集即每一个交易都与一个唯一的 t _blank 标识符TID(Transaction ID)对应关联规则在D中的 t _blank 支持度(support)是D中事务同时包含XY的百分比即 t _blank 概率 t _blank 置信度(confidence)是D中事务已经包含X的情
include<fstream>include<iostream>include<>using namespace stdchar shop[10] 用于存放每一种商品int sn 商品信息(商品种类数)int tr[100][100]l[100]tn tr记录事务信息(数字化之后的事务信息)l记录每条事务包含的商品数tn记录总共有多少条事务记录int min_sup
include <stdio.h>include <malloc.h>include <memory.h>define BOOL int C语言中没有布尔型define FALSE 0 定义假的值为0define TRUE 1 定义真的值为1 item结构体用于存储数据集中项的信息其中所有项以单
第31 卷第2 期
违法有害信息,请在下方选择原因提交举报