楼主: Yvonne9508
1153 4

[数据管理求助] 求问,stata根据分类算出变量均值后为什么均值的个数还是原先数据集的个数 [推广有奖]

  • 0关注
  • 0粉丝

本科生

77%

还不是VIP/贵宾

-

威望
0
论坛币
38 个
通用积分
3.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1313 点
帖子
43
精华
0
在线时间
95 小时
注册时间
2015-11-18
最后登录
2020-7-25

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
原数据大概是这样的:
Code      Date             closingprice
000001   20090101        24
000001   20090102        23
000001   20090103        25
……
000001   20091231        22
000002   20090101        18
000002   20090102        19
000002   20090103        19
……
000002   20091231        21

……

我想根据每个代码(就是第一列code)计算日平均的closingprice
用了bys Code: egen price=mean(closingprice)
按理说算出来应该是有几只股票就会有几个均值,也就是price的个数
但是这样算出来sum(price)以后发现price的个数还是和所有的closingprice的个数一样。。。
求解

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:000002 000001 日平均

沙发
蓝色 发表于 2019-4-10 06:35:27 来自手机 |只看作者 |坛友微信交流群
你先把egen

collapse
的区别搞清楚就明白了

看这两个命令manual里面的例子和解释

使用道具

藤椅
黃河泉 在职认证  发表于 2019-4-10 06:46:19 |只看作者 |坛友微信交流群
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        请参考说明 https://bbs.pinggu.org/thread-5048204-1-1.html

使用道具

板凳
ermutuxia 发表于 2019-4-10 10:06:27 |只看作者 |坛友微信交流群
你好,你用的egen命令没有去重功能,你的计算公式是正确的,因为同一个股票有很多行,而这些行对应的平均值是一样的,每一行对应同一个平均值,因为你的数据总行数没有变化,如果你想要有多少股票就有多少行平均数的话,用完上面的egen命令后,需要用一下下面的命令去重一下
duplicates drop Code,force
keep Code price
这样的化每一支股票就只有一个平均数了

使用道具

报纸
Yvonne9508 发表于 2019-4-10 21:33:40 |只看作者 |坛友微信交流群
ermutuxia 发表于 2019-4-10 10:06
你好,你用的egen命令没有去重功能,你的计算公式是正确的,因为同一个股票有很多行,而这些行对应的平均值 ...
谢谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-4 04:14