4283 6

[问答] cspade 挖掘序列模式的问题 [推广有奖]

  • 0关注
  • 2粉丝

已卖:151份资源

博士生

38%

还不是VIP/贵宾

-

威望
0
论坛币
172 个
通用积分
0
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
5580 点
帖子
170
精华
0
在线时间
283 小时
注册时间
2014-3-12
最后登录
2023-3-25

楼主
呵呵哼哼哈哈 发表于 2016-7-23 11:11:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
# 代码参考李明《R语言与网站分析》
library(arulesSequences)

tmp_data<-data.frame(item=factor(c("A","B","B","A","B","A","C","A","B","C","B","A","B","A","A","B","A","B")))#必须是factor
tmp_data.tran<-as(tmp_data,"transactions")
transactionInfo(tmp_data.tran)$sequenceID<-c(1,1,1,1,1,2,2,2,2,2,2,3,3,3,4,4,4,4)
transactionInfo(tmp_data.tran)$eventID<-c(10,10,20,30,30,20,20,30,30,30,50,10,30,40,30,30,40,50)
transactionInfo(tmp_data.tran)

#lab1:基本约束support(默认为0.1)
s_result<-cspade(tmp_data.tran,parameter = list(support = 0.75),control = list(verbose = TRUE))

代码如上,报错信息: Error in makebin(data, file) : 'eid' invalid (strict order),
想请教大家,这里要求eventid必须是严格有序的吗?按理说不应该啊,因为一个event可以包含有多个items。
用过的朋友们,求赐予帮忙~~





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:cspade SPADE 序列模式 pad CSP library 网站

沙发
Tessie1992 发表于 2017-4-15 14:12:58
并不是要求eventid必须是严格有序,而是在一个sequenceID下,eventID不能重复,可以将eventID赋值部分修改为
transactionInfo(tmp_data.tran)$eventID<-c(1,2,3,4,5,1,2,3,4,5,6,1,2,3,1,2,3,4)
已成功执行,望采纳
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
admin_kefu + 10 + 20 + 2 + 2 + 2 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 20  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

藤椅
呵呵哼哼哈哈 发表于 2017-4-18 17:36:46
Tessie1992 发表于 2017-4-15 14:12
并不是要求eventid必须是严格有序,而是在一个sequenceID下,eventID不能重复,可以将eventID赋值部分修改为 ...
这里eventID 不是表示时间的信息嘛?重新赋值不会改变时间的信息吗?

板凳
Tessie1992 发表于 2017-4-20 13:45:00
呵呵哼哼哈哈 发表于 2017-4-18 17:36
这里eventID 不是表示时间的信息嘛?重新赋值不会改变时间的信息吗?
是事件ID,通常以时间戳表示,一个序列里边的时间戳也不能重复,是有先后顺序的

报纸
Tessie1992 发表于 2017-4-20 14:00:02
呵呵哼哼哈哈 发表于 2017-4-18 17:36
这里eventID 不是表示时间的信息嘛?重新赋值不会改变时间的信息吗?
我又想了下这个事情,可能是咱们没有设置某项默认值,现在提示的信息的原因应该就是eventid不能重复,在序列模式算法里,一个event是可以有多个项,此时建议将数据导出,重新导入数据用read_baskets,其他的我就不会了

地板
sdkdzlm 发表于 2017-4-26 15:46:57
同样的问题,eventID  不重复,数据量小时不报错,数据量大时依然报错 'eid' invalid (strict order),崩溃了

7
夏落小7 发表于 2017-11-14 09:15:05
library(arulesSequences)
item<-factor(c("A,B","B","A,B","A,C","A,B,C","B","A","B","A","A,B","A","B"))
seqid<-c(1,1,1,2,2,2,3,3,3,4,4,4)
eventid<-c(10,20,30,20,30,50,10,30,40,30,40,50)
SIZE<-c(2,1,2,2,3,1,1,1,1,2,1,2)
data<-data.frame(item)
data.tran<-as(data,"transactions")
transactionInfo(data.tran)$sequenceID<-seqid
transactionInfo(data.tran)$eventID<-eventid
transactionInfo(data.tran)$SIZE<-SIZE
transactionInfo(data.tran)
library(arulesSequences)
result<-cspade(data.tran,parameter=list(support=0.5),control=list(verbose=TRUE))
result<-sort(result,by="support")
inspect(result)
这些写就没有问题啦!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-20 15:22