楼主: raymond87
1792 2

[数据管理求助] 筛选个案——如何去掉同一个cluster中的重复个案? [推广有奖]

  • 1关注
  • 0粉丝

已卖:120份资源

本科生

41%

还不是VIP/贵宾

-

威望
0
论坛币
24 个
通用积分
19.7596
学术水平
6 点
热心指数
12 点
信用等级
4 点
经验
749 点
帖子
67
精华
0
在线时间
87 小时
注册时间
2008-4-20
最后登录
2018-6-7

楼主
raymond87 发表于 2014-6-10 15:12:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教各位老师、同学一个数据管理的问题:

本人的数据结构是个人嵌套于家庭的形式。
经过处理后,我把家庭中其他成员的信息都匹配到每一个成员的个案中。
即,每一条个案都包含了整个家庭中所有成员的信息。(如下表)

那么,怎么去掉冗余的个案呢?


数据结构如下:
家庭编号 个人编号 配偶编号  个人年龄 配偶年龄
fid pid sidpagesage
1011010011010023836
1011010021010013638
1021020011020046568
1021020021020033638
1021020031020023836
1021020041020016865


对于101这样的家庭,任意删掉一个个案就可以了。
但是对于102这样包含了两对夫妇的家庭,删除哪两个,就成问题了(我的实际数据中还有三代同堂6个人的情况)

请教各位老师和同学,怎么在102家庭中去掉多余的个案?

谢谢大家!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Cluster 重复个案 CLU pages 数据结构 如何

沙发
raymond87 发表于 2014-6-10 18:50:46
{:3_48:}

藤椅
ywh19860616 发表于 2014-6-12 08:41:02
删除的规则,你应该要比别人清楚,因为并不是所有人
都用这个数据。这里可能能够给你的提示就是如何完成
你需要的删除。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 16:06