楼主在去除重复数据时候发现,有的数据项其他字段信息完全相同,仅有一个 日期的字段不重复。例如:
姓名 年龄 性别 参加日期
张三 12 男 201510
张三 12 男 201509
李四 13 女 201301
李四 13 女 201402
我只想选取参加日期较大的数据保留,其余的重复项删除。即结果是:
姓名 年龄 性别 参加日期
张三 12 男 201510
李四 13 女 201402
我现在想到的方法是对姓名和参加日期降序排序,然后by 其他变量 去除重复值,不知道行不行。
不知道各位大神有没有更加简洁明了的方式实现?