楼主: yanmingsleep
2585 9

[实际应用] 求助,数据清理做法 [推广有奖]

  • 0关注
  • 0粉丝

初中生

23%

还不是VIP/贵宾

-

威望
0
论坛币
990 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
62 点
帖子
7
精华
0
在线时间
13 小时
注册时间
2013-3-8
最后登录
2019-4-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
问题,已有数据矩阵A,第一列为主键,是个人学号,全年级的成绩信息;矩阵B是一班所有人学号,只有学号;我该如何使用R软件将在一班人的成绩得到。大致是这个意思,关于数据清理只用的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据清理 如何使用 所有人 r软件 清理

沙发
诸葛山下 发表于 2015-1-26 17:29:35 |只看作者 |坛友微信交流群
先两个数据集读入R,再用B中学号去A中匹配,并提取。

使用道具

藤椅
yanmingsleep 发表于 2015-1-26 18:05:35 |只看作者 |坛友微信交流群
诸葛山下 发表于 2015-1-26 17:29
先两个数据集读入R,再用B中学号去A中匹配,并提取。
使用什么命令,能具体说明一下吗?

使用道具

板凳
ryoeng 在职认证  发表于 2015-1-26 19:29:37 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

报纸
calsunny 发表于 2015-1-27 12:27:29 |只看作者 |坛友微信交流群
merge by

see here: http://stackoverflow.com/questions/1299871/how-to-join-data-frames-in-r-inner-outer-left-right

Outer join: merge(x = df1, y = df2, by = "CustomerId", all = TRUE)

Left outer: merge(x = df1, y = df2, by = "CustomerId", all.x=TRUE)

Right outer: merge(x = df1, y = df2, by = "CustomerId", all.y=TRUE)

Cross join: merge(x = df1, y = df2, by = NULL)
已有 1 人评分经验 收起 理由
李会超 + 20 精彩帖子

总评分: 经验 + 20   查看全部评分

使用道具

地板
yanmingsleep 发表于 2015-1-27 13:13:36 |只看作者 |坛友微信交流群
ryoeng 发表于 2015-1-26 19:29
R一下正则表达式相关文章。
在df1和df2中使用apply+正则表达式
http://www.rseek.org
对的,就是这个东西,正则表达式,又学习了一招,万分感谢

使用道具

7
yanmingsleep 发表于 2015-1-27 13:24:00 |只看作者 |坛友微信交流群
calsunny 发表于 2015-1-27 12:27
merge by

see here: http://stackoverflow.com/questions/1299871/how-to-join-data-frames-in-r-inner ...
Thanks a lot,
还是四个实用
Outer join: merge(x = df1, y = df2, by = "CustomerId", all = TRUE)

Left outer: merge(x = df1, y = df2, by = "CustomerId", all.x=TRUE)

Right outer: merge(x = df1, y = df2, by = "CustomerId", all.y=TRUE)

Cross join: merge(x = df1, y = df2, by = NULL)

使用道具

8
东城Lee 发表于 2015-1-27 18:10:27 |只看作者 |坛友微信交流群
是不是对文献里的各种高大上的图羡慕嫉妒恨?是不是对着杂乱的结果无从美图秀秀,no problem,let's DIY,在www.datashow.com.cn,随便你任性

使用道具

9
诸葛山下 发表于 2015-1-27 19:36:32 |只看作者 |坛友微信交流群
ryoeng 发表于 2015-1-26 19:29
R一下正则表达式相关文章。
在df1和df2中使用apply+正则表达式
http://www.rseek.org
这个如果是数值型的话,好像不要用正则就可以完成啊!

使用道具

10
yanmingsleep 发表于 2015-1-29 11:07:14 |只看作者 |坛友微信交流群
诸葛山下 发表于 2015-1-27 19:36
这个如果是数值型的话,好像不要用正则就可以完成啊!
实际应用中不是数值的,是邮箱的地址作为主键的,还是要谢谢你

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 02:46