签到
苹果/安卓/wp
苹果/安卓/wp
客户端
0.0
0.00
推广加币
数据VIP
升级SVIP
注册
|
登录
项目交易
CDA数据分析师
CDA网校
CDA社区
CDA认证考试
CDA俱乐部
CDA Live
在线教育
JG学术培训
经管云课堂
CDA网校
CDA数据分析研究院
统计软件培训
金融科技
就学培训网
经管题库
培训证书查询
成为签约讲师
经管文库
专家入驻
学术博客
就学平台
美国在职研究生
论坛BBS
服务一览
VIP服务
数据VIP
数据库
兑换商城
广告服务
案例库
软件销售
校园代理
文献下载
会员课服务
我的
帖子
收藏
好友
我的空间
关注的人
关注的贴
找人
文库
任务
道具
勋章
网站地图
搜索
搜索
用户
人大经济论坛
›
标签
›
Statistics
标签: Statistics
经管大学堂:名校名师名课
相关帖子
版块
作者
回复/查看
最后发表
[分享]Statistics for Research【3rd.Edition】-2004(研究用统计学 第3版)
计量经济学与统计软件
zhangyufu001
2008-12-28
39
9165
lnulxg
2022-6-9 05:28:46
[下载]All of Statistics, Wasserman
经济金融数学专区
kzen
2008-5-26
49
25504
LudwigEisberg
2020-4-12 17:14:19
[下载]*1元店* All of Nonparametric Statistics by Wasserman
计量经济学与统计软件
kzen
2008-4-27
26
9981
LudwigEisberg
2020-4-12 17:12:07
[下载]springer的Matrix Algebra:Theory, Computations, and Applications in Statistics
计量经济学与统计软件
zfk
2007-9-2
55
21283
tianwk
2019-7-20 00:16:49
[下载]IMF - International Financial Statistics 1979 - 2008 Excel Data
数据交流中心
xiayongp
2009-4-1
27
7536
franklj16
2019-7-17 12:01:55
[下载]Applied statistics and the SAS programming language
数据分析与数据科学
qt600
2007-2-28
185
57118
dwshmu
2017-11-30 23:52:43
[下载][原创]Pharmaceutical Statistics Using SAS: A Practical Guide
数据分析与数据科学
sascylindrical
2009-5-27
63
18181
dxj401
2016-12-30 16:40:49
Statistics with STATA 9的配套数据文件
计量经济学与统计软件
wangxy
2006-10-8
32
10745
mnbv20003
2016-4-13 00:57:18
[下载]Introduction to Mathematical Statistics_Hogg_4th.pdf
计量经济学与统计软件
lffcynthia
2009-6-6
39
9731
kuayueriguang
2016-1-1 12:56:44
[下载]John Wiley and Sons.Applied Data Mining- Statistical Methods for Business an
数据分析与数据挖掘
dylan_c
2009-6-7
69
14173
joewaters
2015-2-28 11:20:31
[分享]好书(英文):A first course in mathematical statistics by C.E. Weatherburn
计量经济学与统计软件
sophiapeng
2009-2-18
16
5770
kiyto
2015-2-26 23:19:38
Generalized Additive Models
R语言论坛
ljianb2005
2009-2-19
23
10881
qxhc
2015-1-25 11:00:42
[下载] Wavelet Methods in Statistics with R
R语言论坛
zhuzhu83
2008-12-30
16
10071
麒麟昊天
2014-6-14 22:36:36
Stata Multivariate Statistics Reference Manual Release 10
计量经济学与统计软件
bookbug
2008-6-2
50
14709
iamaxing21
2012-3-20 22:17:40
Computational Statistics Handbook with MATLABRegrToolbox5回归分析工具箱MatLab工程数学应用-希望对
SPSS论坛
bhgb
2007-6-17
1
2864
bhgb
2011-12-1 12:19:01
[下载]2008年IFS(International Financial Statistics)
数据交流中心
taoge31
2009-1-25
58
9757
gswang158
2011-11-22 06:49:30
International trade statistics 2006(...free...)
数据交流中心
xiaoxuanfeng
2006-12-31
18
3579
tamtam701013
2011-11-4 06:14:33
[原创]国外统计学原版教材:Statistics
经济社会统计专版
wangkang1984
2006-12-24
35
12269
xdzhangtao
2011-11-3 13:04:40
Multivariate Applied Statistics
计量经济学与统计软件
OKEY
2005-7-30
9
3372
wfsun123
2011-10-7 23:24:56
更多...
相关日志
分享
R语言-Multivariate Statistics (多元统计)-(转载)
lww1993
2014-5-30 10:45
Multivariate Statistics (多元统计) 网址: http://cran.r-project.org/web/views/Multivariate.html 维护人员:Paul Hewson 版本:2008-02-08 翻译:R-fox, 2008-04-04 基 本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面做个简要的综述。多元统计的特殊应用在CRNA的 其它任务列表(task view)里也会提及,如:排序(ordination)会在Environmetrics( http://cran.r-project.org/web/views/Environmetrics.html )里说到;有监督的分类方法能在MachineLearning( http://cran.r-project.org/web/views/MachineLearning.html )里找到;无监督的分类在Cluster( http://cran.r-project.org/web/views/Cluster.html )里。 这里要综述的包主要分为以下几个部分: 1) 多元数据可视化(Visualising multivariate data): 绘图方法: 基 本画图函数(如:pairs()、coplot())和lattice包里的画图函数(xyplot()、splom())可以画成对列表的二维散点 图,3维密度图。car包里的scatterplot.matrix()函数提供更强大的二维散点图的画法。cwhmisc包集合里的cwhplot包的 pltSplomT()函数类似pair()画散点图矩阵,而且可以在对角位置画柱状图或密度估计图。除此之外,scatterplot3d包可画3维的 散点图,aplpack包里bagplot()可画二变量的boxplot,spin3R()可画可旋转的三维点图。misc3d包有可视化密度的函数。 YaleToolkit包提供许多多元数据可视化技术,agsemisc也是这样。更特殊的多元图包括:aplpack包里的faces()可画 Chernoff’s face;MASS包里的parcoord()可画平行坐标图(矩阵的每一行画一条线,横轴表示矩阵的每列);graphics包里的stars()可画 多元数据的星状图(矩阵的每一行用一个星状图表示)。ade4包里的mstree()和vegan包里的spantree()可画最小生成树。 calibrate包支持双变量图和散点图,chplot包可画convex hull图。geometry包提供了和qhull库的接口,由convexhulln()可给出相应点的索引。ellipse包可画椭圆,也可以用 plotcorr()可视化相关矩阵。denpro包为多元可视化提供水平集树形结构(level set trees)。graphics包里的mosaicplot()和vcd包里的mosaic()函数画马赛克图(mosaic plot)。gclus包提供了针对聚类的散点图和平行坐标图。rggobi包和DescribeDisplay包是GGobi的接 口,DescribeDisplay的图可达到出版质量的要求;xgobi包是XGobi和XGvis的接口,可实现动态交互的图。最后,iplots包 提供强大的动态交互图,尤其是平行坐标图和马赛克图。seriation包提供seriation方法,能重新排列矩阵和系统树。 数据预处理: AIS 包提供多元数据的初步描述函数。Hmisc包里的summarize()和summary.formula()辅助描述数据,varclus()函数可做 聚类,而dataRep()和find.matches()找给定数据集的典型数据和匹配数据。KnnFinder包里的nn()函数用kd-tree找 相似变量的个数。dprep包为分类提供数据预处理和可视化函数,如:检查变量冗余性、标准化。base包里的dist()和cluster包里的 daisy()函数提供距离计算函数;proxy包提供更多的距离测度,包括矩阵间的距离。simba包处理已有数据和缺失数据,包括相似性矩阵和重整 形。 2) 假设检验(Hypothesis testing): ICSNP包提供霍特林(Hotellings)T2检验和许多非参 检验方法,包括基于marginal ranks的位置检验(location test),计算空间中值和符号,形状估计。cramer包做两样本的非参检验,SpatialNP可做空间符号和秩检验。 3) 多元分布(Multivariate distributions): 描述统计(Descriptive measures): stats 包里的cov()和and cor()分别估计协方差和相关系数。ICSNP包提供几种数据描述方法,如:spatial.median()估计空间中值,其它的函数估计 scatter。MASS包里的cov.rob()提供更健壮的方差/协方差矩阵估计。covRobust包用最近邻方差估计法估计协方差。 robustbase包的covMCD()估计协方差和covOGK()做Orthogonalized Gnanadesikan-Kettenring。rrcov包提供可扩展和稳健的估计函数covMcd()、covMest()。corpcor包可计 算大规模的协方差和偏相关矩阵。 密度估计和模拟(Densities (estimation and simulation)): MASS 包的mvrnorm()产生多元正态分布的随机数。Mvtnorm包有多元t分布和多元正态分布的概率和分位数函数,还可计算多元正态分布的密度函数。 mvtnormpcs包提供基于Dunnett的函数。mnormt包提供元t分布和多元正态分布的密度和分布函数,并可产生随机数。sn包提供多元偏t 分布和偏正态分布的密度、分布、随机数函数。delt包提供了许多估计多元密度的函数方法,如:CART和贪婪方法。CRAN的Cluster任务列表( http://cran.r-project.org/web/views/Cluster.html ) 有更全面的信息,ks包里的rmvnorm.mixt()和dmvnorm.mixt()函数产生随机数和估计密度,bayesm包里有多种拟合方法。很 多地方都提供了模拟Wishart分布的函数,如:bayesm包里的rwishart(),MCMCpack包里的rwish(),而且 MCMCpack包还有密度函数dwish()。KernSmooth 包里的bkde2D()和MASS包的kde2d()做分箱(binned)或不分箱二维核密度估计。ks包也像ash和GenKern包样可做核平滑 (kernel smoothing)。prim包用法找高维多元数据的高密度区域,feature包可计算多元数据的显著特征。 正态检验(Assessing normality): mvnormtest 包提供Shapiro-Wilks检验的多元数据延伸方法,mvoutlier包检测多元离群点(outlier),ICS包可检验多元正态分布。 energy 包里的mvnorm.etest()基于E统计量做正态检验,k.sample()检验多个数据是否来自同一分布。dprep 包里的mardia()用Mardia检验正态性。stats包里的mauchly.test()可检验Wishart分布的协方差矩阵。 连接函数(Copulas): copula 包提供常规的copula函数的程序,包括:normal, t, Clayton, Frank, Gumbel。fgac包提供generalised archimedian copula,mlCopulaSelection包可做二变量的copula。 4) 线形模型(Linear models): stats 包里的lm()可做多元线形模型,anova.mlm()比较多个多元线形模型,manova()做多元方差分析(MANOVA)。sn包的 msn.mle()和 and mst.mle()可拟合多元偏正态和偏t分布模型。pls包提供偏最小二乘回归(PLSR)和主成分回归;ppls包可做惩罚偏最小二乘回归;dr包提 供降维回归方法,如.:片逆回归法(Sliced Inverse Regression)、片平均方差估计(sliced average variance estimation)。plsgenomics包做基于偏最小二乘回归的基因组分析。relaimpo包可评估回归参数的相对重要性。 5) 投影方法(Projection methods): 主成分(Principal components): stats 包的prcomp()(基于svd())和princomp()(基于eigen())能计算主成分。sca包做单分量分析。nFactors可评价碎石 图(Scree plot),paran包可评估主成分分析得到的主成分和因子分析得到的因子。pcurve包做主曲线(Principal Curve)分析和可视化。gmodels包提供适合大矩阵的fast.prcomp()和fast.svd()。kernlab包里的kpca()用核 方法做非线性的主成分分析。pcaPP包用投影寻踪(projection pursuit)法计算稳健/鲁棒(robust)主成分。amap包的acpgen()和acprob()函数分别针对广义(generalized) 和稳健(robust)主成分分析。主成分在很多方面也有相应的应用,如:涉及生态的ade4包,感官的SensoMinR包。psy包里有用于心理学的 各种程序,与主成分相关的有:sphpca()用球形直观表示相关矩阵,类似于3D的PCA;fpca()图形展示主成分分析的结果,而且允许某些变量间 有相关性;scree.plot()图形展示相关或协方差矩阵的特征值。PTAk包做主张量分析(Principal Tensor Analysis)。smatr包提供关于异速生长(allometry)的函数。 典型相关(Canonical Correlation): stats包里的cancor()是做典型相关的函数。kernlab包提供更稳健的核方法kcca()。concor包提供了许多concordance methods。 冗余度分析(Redundancy Analysis): calibrate包里的rda()函数可做冗余度分析和典型相关。fso包提供了模糊集排序(Ordination)方法。 独立成分(Independent Components): fastICA 包用fastICA算法做独立成分分析(ICA)和投影寻踪分析(Projection Pursuit),mlica包提供独立成分分析的最大似然拟合,PearsonICA包用基于互信息的打分函数分离独立信号。ICS包能执行不变坐标系 (invariant coordinate system)和独立成分分析(independent components)。JADE包提供就JADE算法的接口,而且可做一些 ICA。 普鲁克分析(Procrustes analysis): vegan包里的procrustes()可做普鲁克分析,也提供排序(ordination)函数。更一般的普鲁克分析可由FactoMineR包里的GPA()实现。 6) 主坐标/尺度方法(Principal coordinates / scaling methods): stats 包的cmdscale()函数执行传统的多维尺度分析(multidimensional scaling,MDS)(主坐标分析Principal Coordinates Analysis),MASS包的sammon()和isoMDS()函数分别执行Sammon和Kruskal非度量多维尺度分析。vegan包提供非 度量多维尺度分析的包装(wrappers)和后处理程序。 7) 无监督分类(Unsupervised classification): 聚类分析: CRAN 的Cluster任务列表全面的综述了R实现的聚类方法。stats里提供等级聚类hclust()和k-均值聚类kmeans()。cluster包里 有大量的聚类和可视化技术,clv包里则有一些聚类确认程序,e1071包的classAgreement()可计算Rand index比较两种分类结果。Trimmed k-means聚类分析可由trimcluster包实现,聚类融合方法(Cluster Ensembles)由clue包实现,clusterSim包能帮助选择最佳的聚类,hybridHclust包提供一些混合聚类方法。energy包 里有基于E统计量的距离测度函数edist()和等级聚类方法hclust.energy()。LLAhclust包提供基于似然(likelihood linkage)方法的聚类,也有评定聚类结果的指标。fpc包里有基于Mahalanobis距离的聚类。clustvarsel包有多种基于模型的聚 类。模糊聚类(fuzzy clustering)可在cluster包和hopach包里实现。Kohonen包提供用于高维谱(spectra)或模式(pattern)的有监 督和无监督的SOM算法。clusterGeneration包帮助模拟聚类。CRAN的Environmetrics任务列表里也有相关的聚类算法的综 述。mclust包实现了基于模型的聚类,MFDA包实现了功能数据的基于模型的聚类。 树方法: CRAN的 MachineLearning任务列表有对树方法的细节描述。分类树也常常是重要的多元方法,rpart包正是这样的 包,rpart.permutation包还可以做rpart()模型的置换(permutation)检验。TWIX包的树可以外部剪枝。 hier.part包分割多元数据集的方差。mvpart包可做多元回归树,party包实现了递归分割(recursive partitioning),rrp包实现了随机递归分割。caret包可做分类和回归训练,进而caretLSF包实现了并行处理。kknn包的k-近 邻法可用于回归,也可用于分类。 8) 有监督分类和判别分析(Supervised classification and discriminant analysis): MASS 包里的lda()和qda()分别针对线性和二次判别分析。mda包的mda() and fda()允许混合和更灵活的判别分析,mars()做多元自适应样条回归(multivariate adaptive regression splines),bruto()做自适应样条后退拟合(adaptive spline backfitting)。earth包里也有多元自适应样条回归的函数。rda包可用质心收缩法(shrunken centroids regularized discriminant analysis)实现高维数据的分类。VR的class包的knn()函数执行k-最近邻算法,knncat包里有针对分类变量的k-最近邻算法。 SensoMineR包的FDA()用于因子判别分析。许多包结合了降维(dimension reduction)和分类。klaR包可以做变量选择,可处理多重共线性,还有可视化函数。superpc包利用主成分做有监督的分类,classPP 包则可为其做投影寻踪(projection pursuit),gpls包用广义偏最小二乘做分类。hddplot包用交叉验证的线性判别分析决定最优的特征个数。supclust包可以根据芯片数 据做基因的监督聚类。ROCR提供许多评估分类执行效果的方法。predbayescor包可做朴素贝叶斯(naiuml;ve Bayes)分类。关于监督分类的更多信息可以看MachineLearning任务列表。 9) 对应分析(Correspondence analysis): MASS 包的corresp()和mca()可以做简单和多重对应分析。ca包提供单一、多重和联合(joint)对应分析。ade4包的ca()和mca()分 别做一般的和多重对应分析。vegan包里也有类似的函数。cocorresp可实现两个矩阵间的co-correspondence分析。 FactoMineR 包的CA()和MCA()函数也能做类似的简单和多重对应分析,还有画图函数。homals执行同质分析(homogeneity)。 10) 前向查找(Forward search): Rfwdmv包执行多元数据的前向查找。 11) 缺失数据(Missing data): mitools 包里有缺失数据的多重估算(multiple imputation)的函数, mice包用chained equations实现了多重估算,mvnmle包可以为多元正态数据的缺失值做最大似然估计(ML Estimation),norm包提供了适合多元正态数据的估计缺失值的期望最大化算法(EM algorithm),cat包允许分类数据的缺失值的多重估算,mix包适用于分类和连续数据的混合数据。pan包可为面版数据(panel data)的缺失值做多重估算。VIM包做缺失数据的可视化和估算。Hmisc包的aregImpute()和transcan()提供了其它的估算缺失 值方法。EMV包提供了knn方法估计缺失数据。monomvn包估计单调多元正态数据的缺失值。 12) 隐变量方法(Latent variable approaches): stats 包的factanal()执行最大似然因子分析,MCMCpack包可做贝叶斯因子分析。GPArotation包提供投影梯度(Gradient Projection)旋转因子法。FAiR包用遗传算法作因子分析。ifa包可用于非正态的变量。sem包拟合线形结构方程模型。ltm包可做隐含式语 义分析 (Latent semantic analysis),eRm包则可拟合Rasch模型(Rasch models)。FactoMineR包里有很多因子分析的方法,包括:MFA()多元因子分析,HMFA()等级多元因子分析,ADFM()定量和定性 数据的多元因子分析。tsfa包执行时间序列的因子分析。poLCA包针对多分类变量(polytomous variable)做潜类别分析(Latent Class Analysis)。 13) 非高斯数据建模(Modelling non-Gaussian data): bivpois 包建模Poisson分布的二变量。mprobit包提供了适合二元和顺序响应变量的多元概率模型。MNP包实现了Bayesian多元概率模型。 polycor包可计算多组相关(olychoric correlation)和四分相关(tetrachoric correlation)矩阵。bayesm包里有多种模型,如:表面非相关回归(Seemingly unrelated Regression),多元logit/probit模型, 工具变量法(Instrumental Variables)。VGAM包里有:广义线形和可加模型(Vector Generalised Linear and Additive Models),减秩回归(Reduced Rank regression)。 14) 矩阵处理(Matrix manipulations): R作为一种基于向量和矩阵的语言,有许多处理矩阵的强有力的工具,由包Matrix和,SparseM实现。matrixcalc包增加了矩阵微积分的功能。spam包提供了更深入的针对稀疏矩阵的方法。 15) 其它(Miscellaneous utitlies): DEA包执行数据包络分析(data envelopment analysis,DEA)。abind包组合多维array。Hmisc 包 的mApply()扩充了apply()的功能。除了前面描述的功能,sn包还未偏正态和偏t分布提供边缘化(marginalisation)、仿射变 换(affine transformations)等。SharedHT2包执行芯片数据的Hotelling's T2检验。panel包里有面版数据(panel data)的建模方法。mAr包可做向量自回归模型(vector auto-regression),MSBVAR包里有贝叶斯向量自回归模型。Hmisc包的rm.boot()函数bootstrap重复测量试验 (Repeated Measures Models)。compositions包提供复合数据分析(compositional data analysis)。 cramer包为两样本数据做多元非参Cramer检验。psy里有许多心理学的常用方法。cwhmisc包集合的 cwhmath包里有许多有趣的功能,如各种旋转函数。desirability包提供了基于密度函数的多变量最优化方法。geozoo包可以画 geozoo包里定义的几何对象。
个人分类:
R语言学习
|
22 次阅读
|
0
个评论
更多...
京ICP备16021002-2号
京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明
GMT+8, 2024-4-25 12:53
积分 0, 距离下一级还需 积分