关联阐明(association analysis)又常称为购物篮阐明,是指假如两个或多个事物之间存在必然的关联,那么个中一个事物就能通过其他事物举办预测.它的目标是为了挖掘埋没在数据间的彼此干系。
关联阐明最常用在市场销售数据中,顾主的购物篮中假如包括啤酒的同时,还包括了尿布,这就展现了这两种物品之间的关联。关联阐明的挖掘任务可解析为两个步调:一是发明频繁项集,二是从频繁项会合发生法则。
下面用R语言中的arules扩展包来实现apriori算法,来举办关联阐明
library(arules)
#从rattle包中读入数据
dvdtrans <- read.csv(system.file(“csv”, “dvdtrans.csv”,package=”rattle”))
数据布局如下,ID暗示购物篮编号,Item暗示物品。
ID Item
1 1 Sixth Sense
2 1 LOTR1
3 1 Harry Potter1
4 1 Green Mile
5 1 LOTR2
6 2 Gladiator
#将数据转化为符合的名目
data <- as(split(dvdtrans$Item, dvdtrans$ID),”transactions”)
#用 apriori呼吁生成频繁项集,设其支持度为0.5,置信度为0.8
rules <- apriori(data, parameter=list(support=0.5,confidence=0.8))
#用inspect呼吁提取法则
inspect(rules)
lhs rhs support confidence lift
1 {Patriot} => {Gladiator} 0.6 1.0000000 1.428571
2 {Gladiator} => {Patriot} 0.6 0.8571429 1.428571
3 {Sixth Sense} => {Gladiator} 0.5 0.8333333 1.190476
这说明购置爱国者影戏的顾主同时也会购置角斗士 🙂
操作apriori算法举办关联阐明
最后更新 2017-12-04 08:00 星期一 所属:
其他教程 浏览:567
