搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  Assessing.SAS.Skill.Level.during.the.Interviewing.Process_133-29.pdf
资料下载链接地址: https://bbs.pinggu.org/a-348849.html
附件大小:
186.77 KB   举报本内容
在一篇Paper(详见附件)里面看到一种办法,用于合并两个有公共变量的数据集。题目和解法如下:

题目:
合并数据集A和B,新表中包含同时出现在A和B里面并且ordernumber相等的obs,A和B的结构如下

Dataset A
ordernumber
firstname
lastname

Dataset B
ordernumber
product
purchase date

解法(by Proc Format):
data b; set b;
start = ordernumber;
label = '*';
fmtname = '$key';
run;

proc sort data=b nodupkey; by start;
run;

proc format cntlin=b;
run;

data all; set a;
if put(ordernumber,$key.) = '*';
run;

这个解法我大致看懂了,它适用于一个表比较小(set b)而另一个表大(set a)而且不方便排序的场合;
可是在我看来,这个解法只能说是从大表(set a)中提取小表(set b)中ordernumber出现的obs,它并没有实现合并,也就是说dataset all里面并没有包括dataset b里除了ordernumber之外的变量;对照该论文给出的其它三种解法,那三种解法都是实在的Merge Code。这样说来,是不是很不严谨呢?很想知道大家怎么看这个问题。望不吝赐教,谢谢。



    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2025-12-28 08:17