楼主: Frances_T
1931 5

[问答] 如何去掉重复行且保留该行最多的信息量 [推广有奖]

  • 0关注
  • 0粉丝

本科生

19%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
60.3467
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
918 点
帖子
56
精华
0
在线时间
81 小时
注册时间
2014-10-1
最后登录
2021-3-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,通过用户id匹配数据后,出现了重复行的情况,但这些重复行中所包含的信息是不同的,所以我想请教下如何在保留最多数据信息的情况下将其他的重复行删掉?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:信息量 如何

沙发
jiangbeilu 学生认证  发表于 2016-4-16 19:54:09 |只看作者 |坛友微信交流群
1.先对这个最多用用户信息作一个定义
2.根据这个定义,建立一个筛选机制
3.构建辅助变量,确定进一步删留数据
已有 1 人评分论坛币 收起 理由
李会超 + 20 精彩帖子

总评分: 论坛币 + 20   查看全部评分

使用道具

藤椅
Frances_T 发表于 2016-4-16 20:45:28 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2016-4-16 19:54
1.先对这个最多用用户信息作一个定义
2.根据这个定义,建立一个筛选机制
3.构建辅助变量,确定进一步删留 ...
您好,可否给些代码的提示呢?

使用道具

板凳
jiangbeilu 学生认证  发表于 2016-4-16 21:00:29 |只看作者 |坛友微信交流群
不知道你的用户信息定义,不好给代码啊

使用道具

报纸
Frances_T 发表于 2016-4-16 21:36:36 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2016-4-16 21:00
不知道你的用户信息定义,不好给代码啊
可以留个联络方式,我将数据发给您,进一步请教么?

使用道具

地板
robbieyeah 发表于 2016-4-17 00:32:53 |只看作者 |坛友微信交流群
我觉得你是在合并数据的时候,Key列的数据有重复。建议在每个数据表格合并前,分别检查一下join字段是否是unique。
已有 2 人评分论坛币 收起 理由
李会超 + 10 精彩帖子
jiangbeilu + 10 鼓励积极发帖讨论

总评分: 论坛币 + 20   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-11 15:14