R in action读书笔记(6)-第七章:基本统计分析(中)-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 会计>>

会计库

>>

R in action读书笔记(6)-第七章:基本统计分析(中)

R in action读书笔记(6)-第七章:基本统计分析(中)

发布:jpld | 分类:会计库

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

7.2频数表和列联表>library(vcd)>head(Arthritis)IDTreatmentSexAgeImproved157TreatedMale27Some246TreatedMale29None377TreatedMale30None417TreatedMale32Marked536TreatedMale46Marked623TreatedMale58Marke ...
免费学术公开课,扫码加入


7.2 频数表和列联表

> library(vcd)

> head(Arthritis)

ID TreatmentSex Age Improved

1 57 Treated Male27 Some

2 46 Treated Male29 None

3 77 Treated Male30 None

4 17 Treated Male32Marked

5 36 Treated Male46Marked

6 23 Treated Male58Marked

7.2.1 生成频数表

函 数 描 述

table(var1, var2, …, varN) 使用 N 个类别型变量(因子)创建一个 N 维列联表

xtabs(formula, data) 根据一个公式和一个矩阵或数据框创建一个 N 维列联表

prop.table(table, margins) 依margins定义的边际列表将表中条目表示为分数形式

margin.table(table, margins) 依margins定义的边际列表计算表中条目的和

addmargins(table, margins) 将概述边margins(默认是求和结果)放入表中

ftable(table) 创建一个紧凑的“平铺”式列联表

  • 一维列联表


> mytable<-with(Arthritis,table(Improved))> mytableImprovedNone Some Marked 42 14 28

可以用prop.table()将这些频数转化为比例值:

> prop.table(mytable)Improved None Some Marked 0.5000000 0.1666667 0.3333333

或使用prop.table()*100转化为百分比:

2. 二维列联表

对于二维列联表,table()函数的使用格式为:mytale<-table(A,B)

其中的A是行变量,B是列变量。除此之外,xtabs()函数还可使用公式风格的输入创建列联表,

格式为:mytable<-xtabs(~A+B,data=mydata)

其中的mydata是一个矩阵或数据框。总的来说,要进行交叉分类的变量应出现在公式的右侧(即~符号的右方),以+作为分隔符。若某个变量写在公式的左侧,则其为一个频数向量(在数据已经被表格化时很有用)。

对于Arthritis数据,有:

> mytable<-xtabs(~Treatment+Improved,data=Arthritis)> mytable ImprovedTreatment None Some MarkedPlacebo 29 7 7Treated 13 7 21

可以使用margin.table()和prop.table()函数分别生成边际频数和比例。行和与行比

例可以这样计算:

> margin.table(mytable,1)TreatmentPlacebo Treated 43 41 > prop.table(mytable,1) ImprovedTreatment None Some MarkedPlacebo 0.6744186 0.1627907 0.1627907Treated 0.3170732 0.1707317 0.5121951

列和与列比例可以这样计算:

> margin.table(mytable,2)ImprovedNone Some Marked 42 14 28 > prop.table(mytable,2) ImprovedTreatment None Some MarkedPlacebo 0.6904762 0.5000000 0.2500000Treated 0.3095238 0.5000000 0.7500000

各单元格所占比例可用如下语句获取:

> prop.table(mytable) ImprovedTreatment None Some MarkedPlacebo 0.34523810 0.08333333 0.08333333Treated 0.15476190 0.08333333 0.25000000

可以使用addmargins()函数为这些表格添加边际和

> addmargins(mytable) ImprovedTreatment None Some Marked SumPlacebo 29 7 743Treated 13 7 2141Sum 42 14 2884> addmargins(prop.table(mytable)) ImprovedTreatment None Some Marked SumPlacebo 0.34523810 0.08333333 0.08333333 0.51190476Treated 0.15476190 0.08333333 0.25000000 0.48809524Sum 0.50000000 0.16666667 0.33333333 1.00000000

在使用addmargins()时,默认行为是为表中所有的变量创建边际和

> addmargins(prop.table(mytable,1),2)#仅添加了各行的和 ImprovedTreatment None Some Marked SumPlacebo 0.6744186 0.1627907 0.1627907 1.0000000Treated 0.3170732 0.1707317 0.5121951 1.0000000

注意 table()函数默认忽略缺失值(NA)。要在频数统计中将NA视为一个有效的类别,请设定参数useNA="ifany"。.

使用gmodels包中的CrossTable()函数是创建二维列联表的第三种方法。CrossTable()

函数仿照SAS中PROC FREQ或SPSS中CROSSTABS的形式生成二维列联表

> CrossTable(Arthritis$Treatment,Arthritis$Improved)

CrossTable()函数有很多选项,可以做许多事情:计算(行、列、单元格)的百分比;指

定小数位数;进行卡方、Fisher和McNemar独立性检验;计算期望和(皮尔逊、标准化、调整的

标准化)残差;将缺失值作为一种有效值;进行行和列标题的标注;生成SAS或SPSS风格的输出。

3.多维列联表

table()和xtabs()都可以基于三个或更多的类别型变量生成多维列联margin.table()、prop.table()和addmargins()函数可以自然地推广到高于二维的情况。另外,ftable()函数可以以一种紧凑而吸引人的方式输出多维列联表

> mytable<-xtabs(~Treatment+Sex+Improved,data=Arthritis), , Improved = None SexTreatment Female MalePlacebo 19 10Treated 6 7, , Improved = Some SexTreatment Female MalePlacebo 7 0Treated 5 2, , Improved = Marked SexTreatment Female MalePlacebo 6 1Treated 16 5 > ftable(mytable) Improved None Some MarkedTreatment Sex Placebo Female 19 7 6 Male 10 0 1Treated Female 6 5 16 Male 7 2 5

> margin.table(mytable,c(1,3))#治疗情况(Treatment) × 改善情况(Improved)的边际频数

ImprovedTreatment None Some MarkedPlacebo 29 7 7Treated 13 7 21
https://pic.bbs.jg.com.cn/forum/201504/18/184005lbzbae6212af7azk.jpg
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-3673702-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。