请选择 进入手机版 | 继续访问电脑版
楼主: yaoyinuo888
1860 4

[问答] 怎么从地址数据中找出满足特定条件的小区 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

11%

还不是VIP/贵宾

-

威望
0
论坛币
1317 个
通用积分
0
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
1233 点
帖子
66
精华
0
在线时间
140 小时
注册时间
2016-6-26
最后登录
2022-2-8

yaoyinuo888 在职认证  发表于 2017-8-11 14:52:35 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
A表有一列关于地址的变量address,B表有一列关于小区的变量village。
现在我想创建一张表C,包含全部A表的内容,且满足:
如果A.address中包含B.village,则把B.village添加到A表后面,
如果A.address中不包含B.village,则添加为缺失。

我的代码如下:
proc sql;
create table c as
select a.*,d.village as village
from a
left join
(select a.address,b.village
from a,b
where find(address,compress(village))>=1) as d
on a.address=d.address;
quit;

结果:C表的观测数大于A表,猜测是因为A.address中某些观测同时包含B.village中多条观测引起的。
请问有什么方法可以解决?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:left join compress proc sql Village address

1.png
已有 1 人评分学术水平 热心指数 收起 理由
eijuhz + 1 + 1 鼓励积极发帖讨论

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

lvmuqu 发表于 2017-8-12 05:38:53 |显示全部楼层 |坛友微信交流群
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下,把对应的多个Village做成多个变量。具体就看你需要怎么使用了。
已有 1 人评分学术水平 热心指数 收起 理由
eijuhz + 1 + 2 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 2   查看全部评分

使用道具

yaoyinuo888 在职认证  发表于 2017-8-12 16:46:48 |显示全部楼层 |坛友微信交流群
lvmuqu 发表于 2017-8-12 05:38
确实是由于一个Address里面包含了多个Village造成的条数变多。
如果不想改变原来A数据集条数,可以转置一下 ...
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。

使用道具

lvmuqu 发表于 2017-8-14 10:54:14 |显示全部楼层 |坛友微信交流群
yaoyinuo888 发表于 2017-8-12 16:46
可以说的再具体一点吗?我就是想要找到(A表address)中包含(B表village)的字符串的观测。
proc sql;
        create table c as
        select a.address,b.village
        from a,b
        where find(address,compress(village))
        ;
quit;
proc transpose data=c out=cc(drop=_name_) prefix=village;
        by address;
        var village;
quit;
proc sql undo_policy=none;
        create table want as
                select distinct a.*,cc.village1,cc.village2
                from a left join cc on a.address=cc.address
        ;
quit;
这样最后出来的条数就不会变了,具体哪些观测含有village你需要再筛选下

使用道具

yaoyinuo888 在职认证  发表于 2017-8-15 09:03:46 |显示全部楼层 |坛友微信交流群
lvmuqu 发表于 2017-8-14 10:54
proc sql;
        create table c as
        select a.address,b.village
明白了,谢谢你的帮助

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-19 17:10