楼主: jacinda
17424 6

急求:如何去掉数据框中重复的数据 [推广有奖]

  • 0关注
  • 0粉丝

高中生

5%

还不是VIP/贵宾

-

威望
0
论坛币
295 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
172 点
帖子
14
精华
0
在线时间
21 小时
注册时间
2008-1-10
最后登录
2012-12-17

楼主
jacinda 发表于 2011-1-11 16:38:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我要处理个大约2万条信息的数据框,但是突然发现里面有些重复的数据,必须把重复的数据抛出,教授催得紧,我实在想不出办法。请高手们指导一下,不胜感激。
大概如下面表格的结构,要分别去掉每个公司中重复的数据。

公司名 利率
2000 1 A a
2000 1 A a
2001 2 A b
2001 3 A c
2000 1 B d
2000 2 B e
2000 2 B e

R中有函数可以做到吗,还是必须写程序控制,
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据框 不胜感激 公司名 数据

沙发
hugebear 发表于 2011-1-11 17:30:09
用unique函数即可

藤椅
jacinda 发表于 2011-1-12 09:15:12
谢谢,我去试试。

板凳
trier2006 发表于 2011-1-12 09:18:29
unique( )               
不过之后要重新整理数据格式
最好的医生是自己,最好的药物是时间……

报纸
楚韵荆风 学生认证  发表于 2011-1-12 21:47:55
> rt
    年 月 公司名 利率
1 2000  1      A    a
2 2000  1      A    a
3 2001  2      A    b
4 2001  3      A    c
5 2000  1      B    d
6 2000  2      B    e
7 2000  2      B    e
> unique(rt)
    年 月 公司名 利率
1 2000  1      A    a
3 2001  2      A    b
4 2001  3      A    c
5 2000  1      B    d
6 2000  2      B    e
> unique(rt,fromLast=TRUE)
    年 月 公司名 利率
2 2000  1      A    a
3 2001  2      A    b
4 2001  3      A    c
5 2000  1      B    d
7 2000  2      B    e

以上是根据你的数据得到的,R中默认的是fromLast=FALSE,即若样本点重复出现,则取首次出现的;否则去最后一次出现的。列名不变,去掉重复样本值之后的行名位置仍为原先的行名位置。
共享是一种彼此的快乐

地板
jiangbeilu 学生认证  发表于 2015-10-22 14:00:55
用duplicated吧,对data frame特别有效

7
jack19880906 发表于 2016-5-23 10:25:03
不错,两个都挺好用:
unique(crul_content)
crul_content[!duplicated(crul_content),]

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 09:31