楼主: kk22boy
1312 6

[其他] 这样的数据要求可以满足吗? [推广有奖]

  • 8关注
  • 95粉丝

一叶知秋

已卖:9095份资源

学科带头人

51%

还不是VIP/贵宾

-

TA的文库  其他...

计量经济与统计

SSCI、权威 论文写作及投稿经验

威望
1
论坛币
57240 个
通用积分
130.1721
学术水平
437 点
热心指数
492 点
信用等级
393 点
经验
68023 点
帖子
1586
精华
0
在线时间
2192 小时
注册时间
2005-3-10
最后登录
2025-5-25

初级热心勋章 初级信用勋章

楼主
kk22boy 发表于 2011-8-2 15:49:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现在有两个样本数据
A
id  year
1   2007
4   2008
5   2007
7   2009
8   2007
B
id    year
1     2005
2     2005
……
8     2005
1     2006
……
8     2006
……
8     2009
这个可以通过编程的形式从B中选择与A相同年份的样本吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:year 样本数据 两个样本 ear 样本数 样本

沙发
h3327156 发表于 2011-8-2 21:17:09
我觉得merge能做的到,
不过,我不太懂您想变成什么样的样本数据,【假设这个新数据是C】
C是由A与B的部份组合构成。

但我很好奇,您C想变成什么样?
从语句中,我无法正确得知,请恕我理解力其差无比。


已有 1 人评分学术水平 热心指数 信用等级 收起 理由
kk22boy + 1 + 1 + 1 谢谢提醒!

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
kk22boy 发表于 2011-8-2 21:50:44
请恕我表达力奇差无比,重新描述
A数据:
id        year        guanlian        guanxi        jiaoyi        leibie        reason
2        2007         0        6        10050        3        1
8        2008                0        6        2000                3        1
12        2007                1        1        7616.68        3        1
14        2007           1        5        960                3        1
20        2008                1        1        2700                3        1
B数据:
id        year        x        y        z
2        2007        6302809386        0.0001        10743695198
2        2008        2931781346        0.0001        17046504584
2        2009        2024489007        0.0001        19978285930
7        2007        163276962.8        0.0001        15706632.56
7        2008        16883871.97        0.0001        178983595.3
7        2009        -167406301.9        0.0001        195867467.3
8        2007        13019060.65        0.0001        27631774.03
8        2008        -5569737.97        0.0001        40650834.68
8        2009        -3370278.21        0.0001        35081096.71
9        2007        -6958670.56        0.0001        758419577.9
9        2008        -149419147.2        0.0001        751460907.3
9        2009        942344037.3        0.0001        602041760.1
10        2007        2792588.29        0.0001        8366595.29
10        2008        -5400667.15        0.0001        11159183.58
10        2009        18770015.17        0.0001        5758516.43
11        2007        143694648.2        0.0001        98467039.17
11        2008        29547040.52        0.0001        242161687.3
11        2009        558346860.4        0.0001        271708727.9
12        2007        779139839                0.0001        480466714
12        2008        -864682922        0.0001        1259606553
12        2009        240694532                0.0001        394923631
14        2007        -20350705.43        0.0001        142733739
14        2008        152681530.3        0.0001        122383033.6
14        2009        89227928.76        0.0001        275064563.8
16        2007        74318588.65        0.0001        678239825.8
16        2008        92468452.59        0.0001        752558414.5
16        2009        -95075450.77        0.0001        845026867.1
17        2007        -2920684.84        0.0001        16982883.27
17        2008        -3975598.9        0.0001        14062198.43
17        2009        12145825.54        0.0001        10086599.53
18        2007        -39015046          0.0001        91671898
18        2008        8711576                0.0001        52656852
18        2009        -5262802                0.0001        61368428
19        2007        -15778591.07        0.0001        36016625.3
19        2008        2263734.06        0.0001        20238034.23
19        2009        68111653.41        0.0001        22501768.29
20        2007        -3337702.59        0.0001        19610336.01
20        2008        -2921882.52        0.0001        16272633.42
20        2009        13802349.03        0.0001        13350750.9

B中每一个样本的数据有三年,而A中每一个样本数据只有一年
要求只保留B中只相关的年份及数据,如id为2的数据A中为2007年,要求保留B中id为2 的样本2007年的数据,2008和2009年的数据不要了,
不知道我这次说清楚了没有?

PS:问题我已经解决了,不过是用的R,希望高手能用stata给出好的解决方法,权当练手了,呵呵!
如果该贴对您有些许帮助,希望你能回复一下或者评一下热心指数!谢谢!

板凳
kk22boy 发表于 2011-8-2 21:51:45
h3327156 发表于 2011-8-2 21:17
我觉得merge能做的到,
不过,我不太懂您想变成什么样的样本数据,【假设这个新数据是C】
C是由A与B的部份 ...
呵呵,希望高手能解决一下
如果该贴对您有些许帮助,希望你能回复一下或者评一下热心指数!谢谢!

报纸
glacierccer 发表于 2011-8-2 23:23:14
tempfile tmp
use A数据,clear
isid id year,sort
save `tmp',replace

use B数据,clear
sort id year
merge id year using `tmp', uniqusing
tab _merge
keep if _merge==3
drop _merge
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
h3327156 + 1 + 1 + 1 我很赞同
kk22boy + 1 + 1 + 1 很有帮助!

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

地板
h3327156 发表于 2011-8-3 18:14:18
其实已经会用R了! 实在没必要再练Stata。
glacierccer的方法是很好的!不过,我对旧版指令比较不熟! 学习了!
在此为方便大家学习,把程序和资料一一弄出如下:【各位可以贴到stata command下,一次执行】

tempfile tmp
input id year guanlian guanxi jiaoyi leibie reason
2 2007 0 6 10050 3 1
8 2008 0 6 2000  3 1
12 2007 1 1 7616.68 3 1
14 2007 1 5 960 3 1
20 2008 1 1 2700 3 1
end
save `tmp',replace

clear
input id year x y z
2 2007 6302809386 0.0001 10743695198
2 2008 2931781346 0.0001 17046504584
2 2009 2024489007 0.0001 19978285930
7 2007 163276962.8 0.0001 15706632.56
7 2008 16883871.97 0.0001 178983595.3
7 2009 -167406301.9 0.0001 195867467.3
8 2007 13019060.65 0.0001 27631774.03
8 2008 -5569737.97 0.0001 40650834.68
8 2009 -3370278.21 0.0001 35081096.71
9 2007 -6958670.56 0.0001 758419577.9
9 2008 -149419147.2 0.0001 751460907.3
9 2009 942344037.3 0.0001 602041760.1
10 2007 2792588.29 0.0001 8366595.29
10 2008 -5400667.15 0.0001 11159183.58
10 2009 18770015.17 0.0001 5758516.43
11 2007 143694648.2 0.0001 98467039.17
11 2008 29547040.52 0.0001 242161687.3
11 2009 558346860.4 0.0001 271708727.9
12 2007 779139839 0.0001 480466714
12 2008 -864682922 0.0001 1259606553
12 2009 240694532 0.0001 394923631
14 2007 -20350705.43 0.0001 142733739
14 2008 152681530.3 0.0001 122383033.6
14 2009 89227928.76 0.0001 275064563.8
16 2007 74318588.65 0.0001 678239825.8
16 2008 92468452.59 0.0001 752558414.5
16 2009 -95075450.77 0.0001 845026867.1
17 2007 -2920684.84 0.0001 16982883.27
17 2008 -3975598.9 0.0001 14062198.43
17 2009 12145825.54 0.0001 10086599.53
18 2007 -39015046 0.0001 91671898
18 2008 8711576 0.0001 52656852
18 2009 -5262802 0.0001 61368428
19 2007 -15778591.07 0.0001 36016625.3
19 2008 2263734.06 0.0001 20238034.23
19 2009 68111653.41 0.0001 22501768.29
20 2007 -3337702.59 0.0001 19610336.01
20 2008 -2921882.52 0.0001 16272633.42
20 2009 13802349.03 0.0001 13350750.9
end

merge 1:1 id year using `tmp'
keep if _merge==3
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
h894510055 + 1 + 1 + 1 热心
kk22boy + 1 + 1 个人感觉计量还是stata实用点,在R中方法并.

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

7
h894510055 发表于 2011-8-3 23:54:50
只是来学习。谢谢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 18:15