楼主: yaoyinuo888
463 4

[问答] 怎么从地址数据中找出满足特定条件的小区 [推广有奖]

  • 0关注
  • 0粉丝

本科生

26%

还不是VIP/贵宾

-

威望
0
论坛币
1407 个
学术水平
2 点
热心指数
1 点
信用等级
0 点
经验
819 点
帖子
49
精华
0
在线时间
78 小时
注册时间
2016-6-26
最后登录
2017-12-15

yaoyinuo888 在职认证  发表于 2017-8-11 14:52:35 |显示全部楼层
A表有一列关于地址的变量address,B表有一列关于小区的变量village。
现在我想创建一张表C,包含全部A表的内容,且满足:
如果A.address中包含B.village,则把B.village添加到A表后面,
如果A.address中不包含B.village,则添加为缺失。

我的代码如下:
proc sql;
create table c as
select a.*,d.village as village
from a
left join
(select a.address,b.village
from a,b
where find(address,compress(village))>=1) as d
on a.address=d.address;
quit;

结果:C表的观测数大于A表,猜测是因为A.address中某些观测同时包含B.village中多条观测引起的。
请问有什么方法可以解决?


支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
 
载入中......
1.png
已有 1 人评分学术水平 热心指数 收起 理由
eijuhz + 1 + 1 鼓励积极发帖讨论

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

stata SPSS
lvmuqu 发表于 2017-8-12 05:38:53 |显示全部楼层
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下,把对应的多个Village做成多个变量。具体就看你需要怎么使用了。
已有 1 人评分学术水平 热心指数 收起 理由
eijuhz + 1 + 2 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 2   查看全部评分

回复

使用道具 举报

yaoyinuo888 在职认证  发表于 2017-8-12 16:46:48 |显示全部楼层
lvmuqu 发表于 2017-8-12 05:38
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下 ...
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。
回复

使用道具 举报

lvmuqu 发表于 2017-8-14 10:54:14 |显示全部楼层
yaoyinuo888 发表于 2017-8-12 16:46
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。
proc sql;
        create table c as
        select a.address,b.village
        from a,b
        where find(address,compress(village))
        ;
quit;
proc transpose data=c out=cc(drop=_name_) prefix=village;
        by address;
        var village;
quit;
proc sql undo_policy=none;
        create table want as
                select distinct a.*,cc.village1,cc.village2
                from a left join cc on a.address=cc.address
        ;
quit;
这样最后出来的条数就不会变了,具体哪些观测含有village你需要再筛选下
回复

使用道具 举报

yaoyinuo888 在职认证  发表于 2017-8-15 09:03:46 |显示全部楼层
lvmuqu 发表于 2017-8-14 10:54
proc sql;
        create table c as
        select a.address,b.village
明白了,谢谢你的帮助
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2017-12-15 20:18