楼主: 童小军
8312 21

[问答] 文件里,只有数字,数字前面还有冒号:,这种数据怎么导入R。 [推广有奖]

  • 1关注
  • 4粉丝

已卖:447份资源

博士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
359 个
通用积分
11.9471
学术水平
32 点
热心指数
31 点
信用等级
19 点
经验
7155 点
帖子
200
精华
0
在线时间
213 小时
注册时间
2012-9-19
最后登录
2024-4-24

楼主
童小军 发表于 2013-8-26 18:55:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据来源:
http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/regression/mg
复制到txt文件
mg.txt (148.78 KB)
只知道数据有6个自变量,1个因变量,一共1385个观测值,怎样将这些数据导入R。
问题来源:吴喜之-《复杂数据统计方法——基于R的应用》,第二章,机器学习回归方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:regression regressio datasets dataset regress 因变量 自变量 统计

沙发
求证1加1 发表于 2013-8-26 19:04:37
之前没碰到过这样的问题,而且不太习惯读txt,暂时没想到专业的解决办法,不过有个笨办法,lz可以先把数据导入excel里,然后再读到R中,这样就一切ok了
个人主页,欢迎订阅http://chenangliu.info/

藤椅
童小军 发表于 2013-8-26 19:21:57
求证1加1 发表于 2013-8-26 19:04
之前没碰到过这样的问题,而且不太习惯读txt,暂时没想到专业的解决办法,不过有个笨办法,lz可以先把数据导 ...
R不是可以直接读取网页里面的数据的吗?会不会他是直接从网页读取的啊?

板凳
求证1加1 发表于 2013-8-26 19:28:42
童小军 发表于 2013-8-26 19:21
R不是可以直接读取网页里面的数据的吗?会不会他是直接从网页读取的啊?
这应该也是可以的,我是顺着你的思路来的
个人主页,欢迎订阅http://chenangliu.info/

报纸
求证1加1 发表于 2013-8-26 19:40:38
童小军 发表于 2013-8-26 19:21
R不是可以直接读取网页里面的数据的吗?会不会他是直接从网页读取的啊?
我后来翻了下书,书上的代码是存在csv的,应该不会是读网页数据的,目测可能跟我的思路差不多,这种情况上我感觉存下来读更方便些,读网页毕竟比较麻烦,当然也可能是我没找到简便方法
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
童小军 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

个人主页,欢迎订阅http://chenangliu.info/

地板
童小军 发表于 2013-8-26 20:39:20
求证1加1 发表于 2013-8-26 19:40
我后来翻了下书,书上的代码是存在csv的,应该不会是读网页数据的,目测可能跟我的思路差不多,这种情况上 ...
发现数据
1.1335086e+00 1:1.0653587e+00 2:8.4250325e-01 3:7.0782984e-01 4:1.0178784e+00 5:1.2476827e+00 6:9.0000000e-01 ……
第一个是因变量,紧接着后面6个是自变量,这样循环着,后面6个自变量从1到6,每个序号后面还都加上了一个冒号:,更难处理了。
还有,数据从网页上复制下来是文本的格式,直接复制到exce里面不行啊,格式不太对,有点搞不定啊。
请问版主有没有吴喜之这本书的电子稿,不甚感激!!

7
qoiqpwqr 发表于 2013-8-26 20:52:18
按列读取就行了

8
童小军 发表于 2013-8-26 20:54:59
qoiqpwqr 发表于 2013-8-26 20:52
按列读取就行了
?能否详细一些。不太明白?

9
求证1加1 发表于 2013-8-26 21:00:24
我说的导入数据不是复制额,电子版没有的,我也是纸质的,顺手把数据弄好了,传个附件lz直接用好了

mg.xls
下载链接: https://bbs.pinggu.org/a-1390710.html

215 KB

mg数据

已有 1 人评分论坛币 收起 理由
admin_kefu + 100 热心帮助其他会员

总评分: 论坛币 + 100   查看全部评分

个人主页,欢迎订阅http://chenangliu.info/

10
童小军 发表于 2013-8-26 21:11:05
求证1加1 发表于 2013-8-26 21:00
我说的导入数据不是复制额,电子版没有的,我也是纸质的,顺手把数据弄好了,传个附件lz直接用好了
求导入方法??
我自己试着直接读取数据,但是自变量前面的序号和冒号:不知道怎么消去。
  1. w<-read.table('http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/regression/mg')
  2. head(w)
  3. str(w)
复制代码
> str(w)
'data.frame':   1385 obs. of  7 variables:
$ V1: num  1.134 1.165 1.032 0.791 0.639 ...
$ V2: Factor w/ 1385 levels "1:1.0000682e+00",..: 153 328 399 160 1063 854 784 1227 302 450 ...
$ V3: Factor w/ 1385 levels "2:1.0000682e+00",..: 1094 728 632 988 1319 1223 151 326 397 158 ...
$ V4: Factor w/ 1385 levels "3:1.0000682e+00",..: 918 1039 138 497 615 472 1095 728 632 988 ...
$ V5: Factor w/ 1385 levels "4:1.0000682e+00",..: 43 92 430 159 6 1015 919 1040 140 498 ...
$ V6: Factor w/ 1385 levels "5:1.0000682e+00",..: 554 16 933 683 748 1234 44 93 431 160 ...
$ V7: Factor w/ 1383 levels "6:1.0000682e+00",..: 1164 1164 1164 1230 270 512 554 16 931 683 ...





您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 08:41