楼主: 一眼瞬间
4985 8

[原创博文] sort by industry之后 怎么才能随机取一个firm-year [推广有奖]

  • 0关注
  • 1粉丝

讲师

50%

还不是VIP/贵宾

-

威望
0
论坛币
730 个
通用积分
0.0001
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
903 点
帖子
376
精华
0
在线时间
309 小时
注册时间
2010-3-14
最后登录
2023-8-19

楼主
一眼瞬间 发表于 2010-3-14 14:39:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教各位前辈:

有很多个firm,每个公司都有很多年,每个公司分别属于特定的industry
sort by industry 之后 怎么随机每个公司取一个firm-year呢?然后构成新的table(因为每个公司有很多年的数据,sort之后取一年就行了)
并count每个industry有多少公司。

谢谢大家了!

---------------------------------------------------
就是样本里面有很多公司,每个公司又有很多年的数据,同时各个公司属于特定的行业
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
333         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994

样本类似长这个样子的  SIC是行业代码
目标:
首先sort by SIC,这样的话就变成:
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
289         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
A 和 D属于一个行业 B和C属于一个行业,但是公司A和D都有很多个obversation
现在要做的是:
怎么把随机选择一个firm-year,也即每个公司只留下一个obversation?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Industry USTR year Dust FIRM industry count 行业 样本

回帖推荐

bobguy 发表于8楼  查看完整内容

SAS provides proc surveyselect that can do a stratified sampling. You may check out the relevant documents. Any sample way is, 1) generate a random number say random_ord=ranuni(123), 2) sort by desired variable + random_ord 3) then pick up first one, last one or other orders as you wish. this way will give you a observation per level randomly. Hope this helps.

本帖被以下文库推荐

沙发
一眼瞬间 发表于 2010-3-14 16:20:59
有木有哪位大牛知道?

还是我问题问的不清楚?

藤椅
xiaosanmao 发表于 2010-3-14 18:15:39
每个公司属于不同的industry?
-------------------------------------
什么叫每个公司属于不同的行业?既生产电视又生产袜子?传说中的集团公司?

板凳
一眼瞬间 发表于 2010-3-15 03:32:51
xiaosanmao 发表于 2010-3-14 18:15
每个公司属于不同的industry?
-------------------------------------
什么叫每个公司属于不同的行业?既生产电视又生产袜子?传说中的集团公司?
谢谢LS,是我表述不清。

就是样本里面有很多公司,每个公司又有很多年的数据,同时各个公司属于特定的行业

SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
333         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994


样本类似长这个样子的  SIC是行业代码

目标:

首先sort by SIC,这样的话就变成:
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
289         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994

A 和 D属于一个行业 B和C属于一个行业,但是公司A和D都有很多个obversation
现在要做的是:

怎么把随机选择一个firm-year,也即每个公司只留下一个obversation?

报纸
一眼瞬间 发表于 2010-3-15 03:35:20
刚想到了 或者还是先随机选公司,再sort才对

怎么才能每个公司随机留下一年的obversation呢?(也即每个公司都必须留下一个obversation)

地板
dreamingboy7 发表于 2010-5-25 22:43:44
我是来看什么是firm-year的。。。

7
jingju11 发表于 2010-5-26 03:42:34
1# 一眼瞬间

随机选择和数据的顺序无关。选择的方法很多。假设你的公司名是独特不重复的。


  1. proc surveyselect data=UrDset method=srs n=1 seed=11 out=SampleSelect;
  2.       strata company;
  3.    run;
复制代码

8
bobguy 发表于 2010-5-26 10:45:48
一眼瞬间 发表于 2010-3-14 14:39
请教各位前辈:

有很多个firm,每个公司都有很多年,每个公司分别属于特定的industry
sort by industry 之后 怎么随机每个公司取一个firm-year呢?然后构成新的table(因为每个公司有很多年的数据,sort之后取一年就行了)
并count每个industry有多少公司。

谢谢大家了!

---------------------------------------------------
就是样本里面有很多公司,每个公司又有很多年的数据,同时各个公司属于特定的行业
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
333         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994

样本类似长这个样子的  SIC是行业代码
目标:
首先sort by SIC,这样的话就变成:
SIC         Company      Year       Other Varaibles
001         A                   1991
001         A                   1992
001         A                   1993
001         A                   1994
001         D                   1991
001         D                   1992
001         D                   1993
001         D                   1994
289         B                   1991
289         B                   1992
289         B                   1993
289         B                   1994
289         C                   1991
289         C                  1992
289         C                  1993
289         C                  1994
A 和 D属于一个行业 B和C属于一个行业,但是公司A和D都有很多个obversation
现在要做的是:
怎么把随机选择一个firm-year,也即每个公司只留下一个obversation?
SAS provides proc surveyselect that can do a stratified sampling. You may check out the relevant documents.

Any sample way is,
1) generate a random number say  random_ord=ranuni(123),
2) sort by desired variable + random_ord
3) then pick up first one, last one or other orders as you wish.

this way will give you a observation per level randomly.

Hope this helps.
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

9
chenjung0825 发表于 2010-5-26 14:41:01
proc sort data=test nodupkey;
by SIC Company;
quit;

This is not random but very easy.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 20:29