本文在针对关联规则的Apriori 算法的基础上,为了提高用户数据挖掘的人机交互性能,解决关联规则挖掘产生冗余规则的问题,提出了基于用户导向的关联规则挖掘方法SQL-IIAR 算法。关键词: 数据挖掘;关联规则;用户导向;SQL-IIAR 算法数据挖掘是一个从大量数据中提取有用的、有趣的知识的处理过程。关联规则数据挖掘是数据挖掘中一种非常重要的模式。关联规则挖掘是指从海量的数据库中挖掘项集之间有趣的关联或相关联系。关联规则的核心挖掘算法是Apriori 算法。但是该算法在挖掘过程中会产生大量候选项集,降低了关联规则挖掘的效率;同时关联规则挖掘会得到大量冗余规则,降低了关联规则挖掘的有效性;并且关联规则挖掘之用户交互性能也较差。目前,诸多的学者针对Apriori 算法的不足,提出NIUA、FUP、partition 法、动态剪枝、PIUA 等等算法,但是总的来说,这些算法较复杂,效率较低,交互性较差。为了方便、快速地从事务数据库中挖掘出用户感兴趣的频繁项集,本文在Apriori 算法的基础上,按照用户设置的规则的前件和后件,将原始事务数据库转化为新的包含规则的前件和后件的新的数据库,通过对数据的预处理,并改进Apriori 算法的挖掘过程,压缩事务数据库,提高了关联规则的质量和效率。
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
评论