楼主: daidaifly
1692 1

[问答] 请教大家一般怎样做data aggregation?特别是很多var情况下? [推广有奖]

  • 0关注
  • 0粉丝

小学生

42%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
102 点
帖子
6
精华
0
在线时间
4 小时
注册时间
2014-4-18
最后登录
2017-6-2

楼主
daidaifly 发表于 2017-5-25 10:44:21 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题, 最近遇到一个问题不知如何解决。主要是想把同一个用户所有行的信息都整合成一行, 但是问题是原始数据有很多变量(100+),这些变量大概可以分成10组,组和组之间肯定是相互独立的, 组之内的变量数不是一定并且最终数值选取的标准不一样。 我试了proc summary,分组proc summary & 基于组间相似变量的macro最后merge,都无法保证每一个变量选取的都是绝对正确。实在是头疼, 不知道大家一般做数据整合是用什么方式? 在这里放一下数据表格和想要的结果,希望大家能多多指教!

ID

Name

DOB

Event1

Time1-A

Time1-B

Event2

Time2-A

Time2-B

Event3

Time3-A

Time3-B

Time3-C

123

JaneD

ABC

CCC

1/1/2017

1/3/2017

.

.

.

.

.

.

.

345

JaneD

ABC

NNN

3/3/2017

3/7/2017

.

.

.

QQQ

4/3/2017

3/5/2017

3/9/2017

456

JaneD

ABC

.

.

.

NNN

11/26/2016

2/9/2017

NNN

5/17/2017

4/7/2017

5/20/2017


筛选的标准:
对于Event123的优先权: CCC>QQQ>NNN
Time#ABC etc. 是基于Event123的,但是在Event123内,选择最大的值
优先选择Event123,再选择TimeABC.

所以根据标准想要的结果:

Name

DOB

Event1

Time1

Event2

Time2

Event3

Time3

JaneD

ABC

CCC

1/3/2017

NNN

2/9/2017

QQQ

4/3/2017


不一定需要解决问题的code,但是如果有什么建议,通过什么方式可以解决,都可以放上来讨论。 再次感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Aggregation ATION Data TIO GRE

沙发
daidaifly 发表于 2017-5-26 21:44:46
希望大家给点建议啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 06:28