楼主: pang20120
4438 25

[其他] R学习笔记 [推广有奖]

  • 5关注
  • 0粉丝

已卖:52份资源

硕士生

59%

还不是VIP/贵宾

-

威望
0
论坛币
329 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
12217 点
帖子
65
精华
0
在线时间
285 小时
注册时间
2013-6-3
最后登录
2025-11-6

楼主
pang20120 发表于 2015-5-10 21:48:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
R语言中的重要数据结构
1.向量  x<-c(1,2,3)
2.字符串  y<-"abc"  mode(y)
字符串操作函数:u<-paste("abc","de") v<-strsplit(u," ")
3.矩阵 m<-rbind(c(1,4),c(2,2)) m[1,2] m[1,]
《R语言实战》m<-matrix(1:20,nrow=5,ncol=4)
cells<-c(1,26,24,68) rnames<-c("R1","R2")
cnames<-c("C1","C2")
mymatrix<-matrix(cells,nrow=2,ncol=2,byrow=T,dimnames=list(rnames,cnames)) mymatrix
mymatrix<-matrix(cells,nrow=2,ncol=2,byrow=F,dimnames=list(rnames,cnames))mymatrix
4.列表 x<-list(u=2,v="abc") hn<-hist(Nile) str(hn) hnprint(hn)
5.数据框d<-data.frame(list(kids=c("jack","jill"),ages=c(12,10))) dd$ages
《R语言实战》patientid<-c(1,2,3,4) age<-c(22,24,35,35)
  diabetes<-c("type1","type2","type3","type4")
status<-c("poor","improved","excellent","poor")
patientdata<-data.frame(patientid,age,diabetes,status)
6.类?
7.拓展案例
getwd() setwd()
grade<-read.table("grade.txt",header=FALSE)
head(grade)
lma<-lm(grade[,2]~grade[,1])
attributes(lma)
lma$coef
lma
summary(lma)
lmb<-lm(grade[,2]~grade[,1]+grade[,3])



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 习笔记 数据结构 R语言 R语言

沙发
pang20120 发表于 2015-5-11 11:27:28
$表示选取一个给定数据框中的某个特定变量
e.g.
patientdata$age
为简化$可以联合使用attach(),detach()或单独使用with()函数
一些基本概念:
数据框:不同的列包含不同的模式(数值型,字符型)的数据
类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)
列表(list):一般来说,列表就是一些对象(或成分,component)的有序集合,列表允许你整合若干(可能无关的)对象到单个对象名下。例如,某个列表中可能是若干个向量,矩阵,数据框,甚至是其他列表的组合。
行和列:row   column
字体:font
副标题:subtitle(简写sub)

藤椅
pang20120 发表于 2015-5-11 11:38:16
因子的使用:
setwd("E:/R")
patientdata<-read.table("patient.txt",header=T)
diabetes<-factor(patientdata$diabetes)
summary(patientdata)

板凳
pang20120 发表于 2015-5-13 09:41:26
安装xlsx包
install.packsges("rJava")
install.packsge("xlsx")
library(xlsx)
??read.xlsx
x<-read.xlsx("tourism.xlsx","sheet4",header=T)

报纸
pang20120 发表于 2015-5-13 10:46:17
图形初步
x<-read.xlsx("tourism.xlsx","sheet4",header=T)
attach(x)
plot(x1,gross)
abline(lm(x1~gross))
title("regression of x1 on gross")
detach(x)
图形参数:
opar<-par(no.readonly=T)
par(lty=2,pch=17)
plot(dose,drugA,type="b")
par(opar)
符号和线条的图形参数:
pch cex lty lwd
颜色参数:
col col.axis col.lab col.main col.sub fg bg
文本属性:
cex cex.axis cex.lab cex.main cex.sub
字体:
font font.axis font.lab font.main font.sub ps family
图形尺寸与边界尺寸:
pin mai mar


地板
pang20120 发表于 2015-5-13 14:19:54
标题:title
坐标轴:side at labele pos lty col las tck
次要刻度线:hmisc包中的minor.tick函数
参考线:abline()
图例:legend()
文本标注:text mtext

7
pang20120 发表于 2015-5-13 14:53:00
基本数据管理:
1.创建一个数据框
manager<-c(1,2,3,4,5)
data<-c("10/24/28","10/28/08","10/1/08","10/12/08","5/1/09")
country<-c("US","US","UK","UK","UK")
gender<-c("M","F","F","M","F")
age<-c(32,45,25,39,99)
q1<-c(5,3,3,3,2)
q2<-c(4,5,5,3,2)
q3<-c(5,2,5,4,1)
q4<-c(5,5,5,NA,2)
q5<-c(5,5,2,NA,1)
ledership<-data.frame(manager,data,country,gender,age,q1,q2,q3,q4,q5,stringsAsFactors=F)

8
pang20120 发表于 2015-5-15 10:12:06
创建新变量:
+ - * / ^或**求幂 %%求余, x%/%y整数除法
变量的重编码
< ,<=, >, >=, ==严格等于,!=不等于,!x非x,x|y    x或y,x&y   x和y,isTRUE(x)    测试x是否为TRUE
语句:variable[condition]<-expression 将仅在condition的值为TRUE 时执行赋值
例:
leadership$agecat[leadership$age  >75 ]<-"elder"
或者
leadership<-within(leadership,{
agecat<-NA
agecat[age>75] <-"elder"
agecat[age>=55&age<=75]<-"middle aged"
agecat[age<55]  <-"young"})
若干个程序包也提供了实用的变量编码函数,特殊的car包中的recode doby包中的recodevar
??within   与函数with

9
pang20120 发表于 2015-5-15 12:25:17
变量的重命名:
fix(leadership)可以调出一个交互界面
reshape包中有rename函数
使用na.omit 删除不完整数据
newdata<-na.omit(leadership)
日期值
%d数字表示的日期
%a缩写的星期名
%A非缩写的星期名
%m月份
%b缩写的月份
%B非缩写的月份
%y两位数的年份
%Y四位数的年份

10
pang20120 发表于 2015-5-16 18:41:10
量化投资packages(quantmod)
矩阵运算:
创建矩阵:a<-matrix(1:12,nrow=3,byrow=T)
矩阵的转置:t(a)
矩阵加减法:+ -
矩阵数乘:*
矩阵乘法:a%*%t(a)   
若A为n×m矩阵,要得到A'B,可用函数crossprod(),该函数计算结果与t(A)%*%B相同,但是效率更高
矩阵中对应元素相乘:a<-matrix(1:9,3,3)  a*a
取方阵的对角元素diag(a)  以该对角元素产生对角阵diag(diag(a))  
产生n维单位阵 diag(n)
矩阵求逆solve() 应用solve(a,b)运算结果是解线性方程组ax=b,若b缺省则默认b为单位阵
矩阵的特征值特征向量函数eigen()
矩阵的Choleskey分解???chol()
矩阵的奇异值分解??scd()
矩阵QR分解 ??qr()
矩阵的广义逆??
矩阵的维数:dim()矩阵维数  nrow行数 ncol列数
行列式的值det(x)
http://blog.csdn.net/hawksoft/article/details/7773323

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 17:47