请选择 进入手机版 | 继续访问电脑版
楼主: momingqimiao7
4912 4

[Stata] 数据量大,分组回归速度慢,可以尝试下parallel多线程 [推广有奖]

经管之家资深用户 Stata小能手 原创数据 专注熟悉领域

巨擘

0%

还不是VIP/贵宾

-

TA的文库  其他...

论文数据收藏

stata技巧

统计学习

威望
1
论坛币
703752 个
通用积分
2810.5537
学术水平
2162 点
热心指数
2076 点
信用等级
1908 点
经验
427373 点
帖子
16320
精华
1
在线时间
65535 小时
注册时间
2009-11-23
最后登录
2024-4-18

初级热心勋章 初级学术勋章 中级热心勋章 高级热心勋章 初级信用勋章 特级热心勋章

momingqimiao7 在职认证  学生认证  发表于 2018-7-27 23:45:21 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
      之前做三因子的模型,数据量比较大,分组回归速度那叫一个慢,后来尝试了parallel大大提高了速度,下面来做一个测试:

      使用test.dta数据,需要循环回归36058次,使用以下命令来计算下运行时间:

  1. use test.dta, clear
  2. timer on 1
  3. statsby _b _se, by(stkcd month) clear: reg  R MKT SMB HML
  4. timer off 1
  5. timer list 1
复制代码
     最终用时:928.83秒。。。

    12.png


      接下来使用parallel命令,使用以下命令来计算下运行时间:
  1. use test.dta, clear
  2. * 如果没有安装parallel的话使用以下命令安装
  3. ssc install parallel, replace
  4. * 设置线程数量
  5. parallel setclusters 8
  6. egen id=group(stkcd month)
  7. sort id
  8. timer on 2
  9. parallel, by(id): statsby _b, by(stkcd month) clear: reg  R MKT SMB HML
  10. timer off 2
  11. timer list 2
复制代码

      最终用时:180.48秒!!!
44.png


      测试所用的数据:
       test.rar (4.6 MB) 本附件包括:
  • test.dta



      两者计算出来的结果是完全一致的。


      当然parallel还有更多用法,可以help parallel了解下
      也可以登Github上去看下:https://github.com/gvegayon/parallel




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:运行时间 三因子 数据量 多线程 大提高 stata 大数据 parallel 多线程

已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Whatsappp + 5 + 3 + 3 + 3 精彩帖子
Sunknownay + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 5  学术水平 + 6  热心指数 + 6  信用等级 + 6   查看全部评分

本帖被以下文库推荐

fin-qq 发表于 2018-8-21 15:54:11 |显示全部楼层 |坛友微信交流群
Thank you for sharing!~

使用道具

求问为什么我的cluster总是有connection error?[img][/img]

使用道具

请问为什么我运行parallel后总是显示  ‘cluster 0001 has finished with a connection error -601- (timeout) (see more)...’

使用道具

yaojia1 发表于 2020-6-11 22:34:01 |显示全部楼层 |坛友微信交流群
楼主可以详细解释一下这一行代码吗?parallel, by(id): statsby _b, by(stkcd month) clear: reg  R MKT SMB HML

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 04:34