本文针对两种常用的频集算法Apriori 和FP-growth,指出了它们各自的优缺点。数据库的表示方法主要有两大类:水平数据表示和垂直数据表示。通常,采用垂直数据表示的算法的性能优于采用水平数据表示的算法。然后在深入分析Eclat 算法的基础上提出了它的一种改进形式的Eclat。改进后的Eclat 的计算性能优于Eclat 和FP-Growth 算法。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。数据挖掘在最近几年也获得了广泛的关注。本文在数据挖掘背景下展开了关联规则挖掘中Eclat 算法及其改进算法的研究工作。传统的频集挖掘算法包括Apriori、FP-Growth 等。Apriori 的改进算法主要考虑减少扫描数据库次数以及产生尽可能少的候选集这两个方面。而FP-Growth 的改进算法则主要考虑减少构建FP 一树的消耗以及尽可能地节省内存。虽然这些改进算法应用在一些数据集中取得了不错的效果,但应用在其它一些数据集可能效率很差。本文主要讨论一种新的算法Eclat,它只需扫描数据库2 次,并且采用交操作来计算支持度。
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
热门文章
评论