楼主: xingxf
7293 35

[编程问题求助] 生成过去特定一段时间特定条件下某ID重复出现的次数 [推广有奖]

31
xingxf 发表于 2013-5-3 19:52:29
voodoo 发表于 2013-5-3 09:43
假如数据量较小的话(先“分而治之”?),这段程序可行。但tsfill也极为耗费时间,在我的电脑上保留前10 ...
您的这个分而治之的思路是目前为止提速的最佳方法了。

32
xingxf 发表于 2013-5-3 22:12:28
voodoo 发表于 2013-5-3 09:43
假如数据量较小的话(先“分而治之”?),这段程序可行。但tsfill也极为耗费时间,在我的电脑上保留前10 ...
我用tsfill,在不加full参数的情况下还是可以的,最后形成几千个obs,总共占用内存约4G,用时也是10几秒,还是不错的。

33
voodoo 发表于 2013-5-3 23:25:21
xingxf 发表于 2013-5-3 22:12
我用tsfill,在不加full参数的情况下还是可以的,最后形成几千个obs,总共占用内存约4G,用时也是10几秒, ...
是几千个obs吧?全样本用时才10几秒吗?你计算机和Stata各是什么配置啊?!
果真如此,怎一个“羡慕嫉妒恨”了得!在我i7 2620M+4G内存+Stata SE 12.0的配置下,保留10000个样本,全程用时11秒,而保留前100000个样本,全程用时约100秒啊。

巫毒上传,必属佳品!
坛友下载,三思后行!

34
xingxf 发表于 2013-5-3 23:57:45
voodoo 发表于 2013-5-3 23:25
是几千万个obs吧?全样本用时才10几秒吗?你计算机和Stata各是什么配置啊?!
若真如何,怎一个“羡慕嫉 ...
对,几千万个,少写了一个万字。
刚才那个不好意思,我没用全样本,我用的预处理的样本跑的,我把为B,E,MA为0的删除了。另外,前后差距太明显,我没准确计时。
这次我用全样本跑了一下,耗时总共2分多,不到3分。
我用的Stata 12 MP,i7 3770,32G内存。

35
xingxf 发表于 2013-5-4 00:15:30
voodoo 发表于 2013-5-3 23:25
是几千万个obs吧?全样本用时才10几秒吗?你计算机和Stata各是什么配置啊?!
若真如何,怎一个“羡慕嫉 ...
我刚才那个是截止到tsfill完成的时间,我把我写的那个程序从头到尾又跑了一遍,计时总共4分17秒。

36
red123star 发表于 2013-5-4 10:52:56
gaobudonga

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 07:05