人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › SAS关于类似python的Tuple(元组)的疑问

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: wps930720

1871 8

[学习分享] SAS关于类似python的Tuple(元组)的疑问 [推广有奖]

3关注
0粉丝

硕士生

88%

还不是VIP/贵宾

威望: 0 级
论坛币: 115 个
通用积分: 10.8524
学术水平: 3 点
热心指数: 5 点
信用等级: 4 点
经验: 5124 点
帖子: 74
精华: 0
在线时间: 337 小时
注册时间: 2013-5-27
最后登录: 2023-8-9

楼主

wps930720

发表于 2018-5-3 15:48:24 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

如题，SAS有类似Tuple(元组)的功能吗？
比如，目前有一个要分析的名单表test，包含变量idcard，name，mobile。
以此作为主表，在mysql数据库中提取相关数据（数据库只有读取权限）。
如何不通过关联查询，找出数据库adc中表table1的各个idcard对应的limit字段的数据。
示例：
*test表导入sas的work库

proc sql;
create table tenp01 as
select idcard,limit
from work.test as a left join abc.table1 as b on a.

idcard=b.idcard;

quit;
。以上方法可以实现，但是如果碰到adc中表table1数据量非常大的情况，跨库adc和work，SAS读取速度非常慢。
试过，把表test的idcard作为宏变量&var1，用where adc.idcard in （&var1）的方法，但是宏变量的长度有限制，最多大概只能64000。
想请教各位大神，有没有什么更好的方法？
（python中是可以把idcard作为一个元组，然后用 in {0}的方法。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：python PLE left join proc sql Create

相关帖子

已有 1 人评分	热心指数	收起理由
eijuhz	+ 2	精彩帖子

总评分: 热心指数 + 2 查看全部评分

使用道具举报

沙发

Tigflanker 发表于 2018-5-5 16:47:06 |只看作者 |坛友微信交流群

我不用SAS也挺久了，现在新入的知识也不知道了

看你筛选表有3个变量，那你筛选的规则是需要筛选表的三个变量联合匹配么？就是obs = 1时idcard+name+mobile都匹配上才算，否则看下一条

如果是并得关系，那你可以试试SQL中的子查询，你主表where语句中可以从catx把那三个key接起来，再子查询筛选表

如果是且得关系，那我有限的记忆，还是推荐你用data步的hash table吧

SAS只有dataframe的数据框架，宏只是协助

已有 1 人评分	论坛币	收起理由
admin_kefu	+ 20	热心帮助其他会员

总评分: 论坛币 + 20 查看全部评分

使用道具举报

藤椅

popodan

发表于 2018-5-6 11:37:00 |只看作者 |坛友微信交流群

速度慢主要是跨库读取关联的缘故，一般这种情况用pass through要比libname快的多。
如果test里的idcard数量太多没法select into：，可以选出distinct idcard，然后只把这些需要关联的idcard也存到abc library里，然后用pass through，速度会快很多。