楼主: yuzangsheng
20888 10

[编程问题求助] stata可以根据2个变量分组进行描述性统计吗 [推广有奖]

  • 0关注
  • 0粉丝

大专生

61%

还不是VIP/贵宾

-

威望
0
论坛币
62 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
553 点
帖子
40
精华
0
在线时间
55 小时
注册时间
2015-6-11
最后登录
2018-12-8

楼主
yuzangsheng 发表于 2018-2-1 15:05:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,我现在的数据有code day ret0 moib0 bidinner0
我现在要进行描述性统计,算得均值和组内 组间标准差
我尝试使用tabstat
tabstat ret0 moib0 bidinner0 statistics( mean sd ) by(code day)

但是提醒by():  too many variables specified
我想知道有没有其他命令可以实现?

同时我的需求实际上是
我先让数据根据code 和day 分组,分别对组内进行温莎处理winsor ,1% 和99%后,算出每一组组内的变量均值
然后再对各组均值结果进行温莎处理,然后最后得到一个总体的 mean st.dev.within和 st.dev.between
stata可以实现我的需求吗?
第一次用stata,求大神。

平时都是用的matlab。数据的预先切割我可以用matlab实现,但是这样我用stata要读取10000多次文件,10000多次描述性统计,再将结果处理。比较繁琐。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 描述性统计 变量分组 tata 描述性

沙发
黃河泉 在职认证  发表于 2018-2-1 16:07:57
建议请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

藤椅
黃河泉 在职认证  发表于 2018-2-1 16:09:06

板凳
yuzangsheng 发表于 2018-2-1 16:26:35
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input long code float ret0 long moib0 float(bidinner0 askinner0 bidouter0 askouter0) long day
  4. 600004           0  -788101  .599848 .454141  .336656 .427242 42009
  5. 600004           0  2404900  .623002 .355068 .0616029 .590871 42009
  6. 600004  .000862069   288812 .0993581 .161718  .707633 .784199 42010
  7. 600004  .000858369   699015  .411662 .327126   .53458 .584298 42010
  8. 600004   .00179292   421947  .321607  .64115  .630175 .264075 42011
  9. 600005  -.00300752 -1302510  .804142 .431731 .0450489 .502035 42009
  10. 600005  .000859107   239003  .262084 .306903  .692675 .323025 42009
  11. 600005  .000897666   291869  .142757 .185371  .835005 .605711 42010
  12. 600005           0  -108001  .402939 .123471  .466013 .626117 42010
  13. 600005 -.000861326  -585676  .210079 .525885  .366683 .470077 42011
  14. end
复制代码



报纸
yuzangsheng 发表于 2018-2-1 16:31:37
黃河泉 发表于 2018-2-1 16:09 https://bbs.pinggu.org/thread-6209467-1-1.html。
谢谢您的指导,我尝试了贴出代表性的数据。
想要实现的功能是
根据code 和day 分组,先winsor,分组做描述性统计(主要是均值和标准差)
然后再将分组的均值进行排列,做一次winsor,做出总体的描述性统计结果。

是不是只能通过编程的方式不断循环呢?

地板
黃河泉 在职认证  发表于 2018-2-1 17:23:39
yuzangsheng 发表于 2018-2-1 16:31
谢谢您的指导,我尝试了贴出代表性的数据。
想要实现的功能是
根据code 和day 分组,先winsor,分组做描 ...
什么叫做"根据code 和day 分组,先winsor"?你有看过谁是这样做的呢?

7
yuzangsheng 发表于 2018-2-1 17:31:42
黃河泉 发表于 2018-2-1 17:23
什么叫做"根据code 和day 分组,先winsor"?你有看过谁是这样做的呢?
是一篇working paper,Intraday Return Predictability, Informed Limit Orders, and Algorithmic Trading
微信图片_20180201173058.png
就是在做股票收益的日内预测。
所以每个回归单位是 stock-day。
目前我的数据如前面贴的那样,相关变量都算出来了。

8
黃河泉 在职认证  发表于 2018-2-1 17:39:13
yuzangsheng 发表于 2018-2-1 17:31
是一篇working paper,Intraday Return Predictability, Informed Limit Orders, and Algorithmic Tradin ...
了解,因为是日内资料。看起来似乎不难,但没有适当资料(即使是代表性资料都会很大),无法实验。请 search winsor2 并安装,请 help winsor2 并特别注意他可以 by(code day)。

9
黃河泉 在职认证  发表于 2018-2-1 17:43:16
yuzangsheng 发表于 2018-2-1 17:31
是一篇working paper,Intraday Return Predictability, Informed Limit Orders, and Algorithmic Tradin ...
我目前的想像是
  1. winsor2 ret0, replace cuts(1 99) by(code day)
  2. winsor2 ret0, replace cuts(1 99)
复制代码
第一阶段,针对 code 与 day 内之资料作 winsorize。之后,第二阶段,对全部资料作 winsorize。

10
yuzangsheng 发表于 2018-2-2 09:36:19
黃河泉 发表于 2018-2-1 17:43
我目前的想像是第一阶段,针对 code 与 day 内之资料作 winsorize。之后,第二阶段,对全部资料作 winsor ...
谢谢老师,请问可以用哪个命令算ret组间和组内标准差呢?我尝试使用xtsum ,报错需要xtset。明显我这组数据不能用xtset,因为(code day)组合并不能作为唯一标识

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 02:43