请选择 进入手机版 | 继续访问电脑版
1640 3

[实际应用] 想破头都没能想明白的SAS匹配 [推广有奖]

  • 0关注
  • 1粉丝

本科生

54%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
1 点
经验
1472 点
帖子
32
精华
0
在线时间
92 小时
注册时间
2016-8-13
最后登录
2020-6-8

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
楼主有两个数据集 A,B.
A: 大小2.1G,字段数210个,观测数120W+;
B:大小150M, 字段数6个,观测数200W+;
两个数据集进行条件匹配后,生成观测条数60W+,字段215个,但是数据集大小却有60G
对于这种现象,实在不知道怎么解释,字段只多了5个,观测数少了一半,但是数据大小却增加了30倍
求问各位,知道这是为什么吗?实在想不通~~


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:条件匹配 数据集

l1i2n3i4n5g 在职认证  发表于 2018-8-17 17:32:33 |显示全部楼层 |坛友微信交流群
1、有可能原数据集压缩过?
2、有可能变量长度变化了?
不知道了

使用道具

l1i2n3i4n5g 发表于 2018-8-17 17:32
1、有可能原数据集压缩过?
2、有可能变量长度变化了?
不知道了
是哒,是我们新数据集没有压缩的原因,谢谢!
那,那,那我顺便再问你一个问题好嘛~~就是我现在匹配的速度很慢,因为他要先sort再去匹配嘛。你知道怎么样能够提升匹配的速度吗?谢谢~~~

使用道具

l1i2n3i4n5g 在职认证  发表于 2018-8-18 10:43:44 |显示全部楼层 |坛友微信交流群
蹦跶的小石头 发表于 2018-8-17 17:56
是哒,是我们新数据集没有压缩的原因,谢谢!
那,那,那我顺便再问你一个问题好嘛~~就是我现在匹配的速 ...
最好就是把没用的变量删除一些再匹配

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 01:21