关联规则和决策树的应用

时间：2026-01-17 来源：未知

小中大

字号：

数据挖掘—关联规则与决策树的应用

关联规则的概念关联规则用来发现在同一事件中出现的不同项的相关性，即找出事务中频繁发生的项或属性的所有子集，以及项目之间的相互关联性。关联规则就是形如XY的逻辑蕴含关系，其中XI,YI且XY=Φ,X称作规则的前件，Y是结果，对于关联规则XY,存在支持度和信任度。关联规则就是支持度和信任度分别满足用户给定阈值的规则。

关联规则的分类基于关联规则中处理的变量的类别，可以分为布尔型和数值型两种。基于规则中数据的抽象层次分类，可以分为单层关联规则和多层关联规则。

关联规则的分类基于模式与规则之间的相互关系分类，可以分为完全频繁模式挖掘、最大频繁模式挖掘和闭合频繁模式挖掘。基于规则中涉及到的数据的维数分类，关联规则可以分为单维的和多维的。基于模式与规则之间的相互关系分类，可以分为完全频繁模式挖掘、最大频繁模式挖掘和闭合频繁模式挖掘。

关联规则的算法 1993年,R.Agrawal等人首次提出了挖掘顾客交易数据中项目集间的关联规则问题，其核心是基于两阶段频繁集思想的递推算法。该关联规则在分类上属于单维、单层及布尔关联规则，典型的算法是Aprior算法。

Apriori的两个步骤第1步：通过迭代，检索出源数据中的所有频繁项集，即支持度不低于用户设定的阀值的项集；第2步：利用第1步中检索出的频繁项集构造出满足用户最小信任度的规则。

Apriori算法的优缺点 Apriori算法的一个突出优势是其对大型数据库的处理能力，不需将事务数据库读入内存就可以完成挖掘任务。缺点是需要多次扫描数据库。

Apriori的改进对其连接和剪枝过程进行优化，在此基础上产生了很多变体。– 大都采用同Apriori同样的产生候选集的思想 – 包括基于hash的技术、划分、取样、使用垂直数据格式等。 – 这些算法的侧重点一般在于：减少扫描数据的次数；减少产生的候选集数目；减少候选频繁项集的计算时间。

关联规则和决策树的应用.doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

上一篇：800个有趣句子帮你记忆7000个单词(完整修正版)-

下一篇：39m预应力T型桥梁工程课程设计

相

关

文

章

分类导航

幼儿教育小学教育初中教育教学研究专业资料资格考试教育文库外语考试高等教育求职职场高中教育实用文档

关联规则和决策树的应用

分类导航

今日头条

每日精选

猜你喜欢

精彩图片

热门标签

关联规则和决策树的应用

推荐阅读

分类导航

今日头条

每日精选

猜你喜欢

精彩图片

热门标签