楼主: burnpark
1308 2

[问答] 数据集合并 [推广有奖]

  • 1关注
  • 2粉丝

已卖:1份资源

讲师

21%

还不是VIP/贵宾

-

威望
0
论坛币
2979 个
通用积分
6.6000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
4270 点
帖子
128
精华
0
在线时间
591 小时
注册时间
2009-3-17
最后登录
2024-10-13

楼主
burnpark 发表于 2014-1-10 12:37:02 |AI写论文
100论坛币
我想要将两个数据集合并,而且合并后a数据集里的所有观测值都要保留, 而b数据集里的观测值只保留与a数据集id相同的,不相同的排除。

a数据集有27320503个观测值,b数据集有972392个观测值,
照理说合并后的数据集c的观测值应该是27320503个,
可是程序运行后c的观测值竟然是27452634个。
我想问下问题出在什么地方?
(我自己做了两个简单的数据集做过测试,最后都能得到我想要的结果)


编写程序如下:

data c;
merge a(in=ina) b;
by id;
if ina;
run;


最佳答案

牵你↗左手 查看完整内容

数据是1对1么?也就是你a中的id和b中的id都是唯一的么,如果是1对多或者多对多就会造成c中的观测多于a中的观测
关键词:数据集 Merge Data 编写程序 观测值 编写程序 而且

沙发
牵你↗左手 发表于 2014-1-10 12:37:03
数据是1对1么?也就是你a中的id和b中的id都是唯一的么,如果是1对多或者多对多就会造成c中的观测多于a中的观测

藤椅
burnpark 发表于 2014-1-13 21:25:34
谢谢,果然是有重复的ID

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 01:04