搜索

tag 标签: 统计学

相关帖子

版块 作者 回复/查看 最后发表
统计学课件(第四版) attachment 计量经济学与统计软件 xiegua 2013-3-2 22 7904 happy_287422301 2019-3-8 15:30:58
如何学好统计学 SPSS论坛 604429726 2013-1-31 23 11037 之江的猫 2018-7-17 16:33:50
人大【统计学】课件 attach_img 商学院 lookios 2013-1-15 49 14454 baoji777 2018-5-7 10:08:29
哈佛评论案例分析经典教材国外购买 attachment 商学院 viclj0113 2013-1-15 12 1812 yyj_1976 2015-7-24 12:46:50
逻辑回归中的调节效用结果分析 SPSS论坛 hxwang2013 2013-3-24 1 1684 bakoll 2015-3-1 09:34:46
哪位有厦大WISE“2013教育部计量经济学与统计学暑期“的电子资料,多谢 计量经济学与统计软件 mayaolan66 2013-7-13 1 962 crystal8832 2015-2-6 10:55:28
辽宁可持续发展能力分析——兼论加强辽宁可持续发展能力建设--统计学 论文版 crystal8832 2013-2-20 3 5078 ljxzwl99 2015-2-4 10:22:09
统计学课件 attachment 杨卫涛-开封大学 kfywt 2013-8-28 8 153 kfywt 2014-11-23 20:12:27
广东工业大学管理学院《管理统计学》PPT attachment 计量经济学与统计软件 Allvis 2013-3-4 7 6000 gxnnhgm66 2014-8-26 15:52:34
悬赏 统计学(时间序列·计量学)的问题,麻烦大神帮看看~ - [悬赏 5 个论坛币] attach_img 计量经济学与统计软件 kamiyasakurako 2013-6-26 4 5058 pkdell 2014-5-10 09:51:12
社会热点密度频率的社会统计学意义/全文 attachment 微观经济学 kurmuyee 2013-2-19 1 5303 yuhoucai 2013-7-30 23:10:41
分享统计学课件(林筱文版) attachment 经济社会统计专版 haizhixuan 2013-5-14 2 798 cup_wh 2013-7-28 08:30:26
应用统计学哦哦 attachment 经济社会统计专版 张小亿惠 2013-7-19 1 1582 oliyiyi 2013-7-19 11:00:09
就业 新手入门区 hxsvicky 2013-6-3 0 549 hxsvicky 2013-6-3 22:09:06
数量管理方法合集 attach_img 计量经济学与统计软件 holigeniuson 2013-3-26 13 1752 83271450 2013-5-15 19:59:12
求助Stata做人口统计学资料的双纵轴条形图,谢谢! attachment Stata专版 兵哥哥 2013-4-25 5 3631 zj20000101 2013-4-27 16:57:55
关于进一步改革和完善贸易统计制度方法的宏观思考——统计学 论文版 crystal8832 2013-2-20 1 867 crystal8832 2013-2-20 10:36:00
财政管理体制改革与统计工作——统计学 论文版 crystal8832 2013-2-20 0 4800 crystal8832 2013-2-20 00:19:15

相关日志

分享 统计学经典书籍推荐
purityly 2015-6-13 20:36
https://bbs.pinggu.org/jg/tongji_tongjixue_3187299_1.html 这是我碰巧在网上看到有人做了一些关于统计学经典书籍推荐和建议的总结,所以特意转载与此,希望对大家有用。 一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》 机械工业出版社 只需要高中的数学水平,统计的扫盲书。有一句话影响很深: Mathematics as to statistics is something like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》 机械工业出版社 看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》 中国统计出版社 在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》 中国统计出版社 和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社 和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》 中国统计出版社 还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》 这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分 析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》 王济川 郭志刚 高等教育出版社 不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》 王学民 上海财经大学出版社 现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。 2、《Analyzing Multivariate Data(英文版)》 Lattin等著 机械工业出版社 这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。 3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson Wichem 著 中国统计出版社 个人认为是国内能买到的最好的多元统计书了。Amazon 上有人评论,评价很高的。不过据王学民老师说,这本书的证明还是有不太清楚,老外实务可以,证明实在不咋的,呵呵 四、时间序列 1、《商务和经济预测中的时间序列模型》 弗朗西斯著 Amazon 上五星推荐的书,讲了很多很新的东西也非常实用。我看完才知道,原来时间序列不知有AR(1) MA(1)啊,哈 2、《Forecasting and Time Series an applied approach(third edition)》 Bowerman Connell 著 本书的主讲Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序 五、抽样 1、《抽样技术》 科克伦著 张尧庭译 绝对是该领域最权威,最经典的书了。王学民老师说:这本书不是那么好懂的,数学系的人,就算看得懂每个公式,未必能懂它的意思(不是数学系的人,还是别看了吧)。 2、《Sampling: Design and Analysis(影印版)》 Lohr著 中国统计出版社 讲了很多很新的方法,无应答,非抽样误差,再抽样,都有讨论。也很不好懂,当时偶是和《Advance Microeconomic Theory》一起看的,后者被许多人认为是梦魇,但是和前者一比,好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊 六、软件及其他 1、《SAS软件与应用统计分析》 王吉利 张尧庭 主编 好书啊!!!! 2、《SAS V8基础教程》 汪嘉冈编 中国统计出版社 主要讲编程,没怎么讲统计。如果想加强SAS编程可以考虑。 3、《SPSS11统计分析教程(基础篇)(高级篇)》 张文彤 北京希望出版社 当初第一次看这本书,发现怎么几乎都看不懂,尤其是高级篇,现在终于搞清楚了:) 4、《金融市场的统计分析》 张尧庭著 广西师范大学出版社 张老师到底是大家,薄薄的一本书,言简意赅,把主要的金融模型都讲清楚了。看完会发现,分析金融单单数学模型还是纸上谈兵,必须加上统计模型和统计方法才能真正应用。本书用的多元统计(代数知识)比较深。 统计学经典书籍推荐第二篇 看到版上有很多人问学统计的话要先看什么书,统计怎么打好基础之类的话题。我现在是概率统计方向的研究生,对于统计也有一个比较粗浅的认识,因此想推荐一些书和方法,希望能够对大家有所帮助。当然其中有说的不对的地方还是希望大家能够指正:) 1、统计需要的数学基础 大多数人学统计基本上来说有微积分+线性代数+概率论的基础就足够了。如果要去做研究,读PHD,并且做一些理论方面的研究,当然就得学一些较深的数学,例如实变函数、测度论等等。但是对于大部分同学的申请Master来说,有微积分、线性代数、概率论,再去看统计,应该就OK了。有人也许要问这些课要学多深,那就得看你想把统计学的多深了,这些课学得越深,统计就能够学得越深。 2、国外学统计以后的出路 就工业界来讲,统计在美国最好的应用是生物统计方向,不过一般制药公司都需要PHD,并且据说这个活儿比较适合女生做,以后我可以转载一篇文章过来让大家看看生物统计的大致内容和前景;另外还有一个比较大的方向是金融统计,去银行证券之类的,要看各人能力了;还有做Faculty,其实中国大量需要统计老师,但是就工业界来讲中国至少现在并不需要很多统计人才。保险精算我感觉没有用到很深的统计 3、数理统计的一些基础教材 这里推荐的几本教材是我所看过并且还觉得挺不错的。有中文有英文的,大家根据自己的水平,选择着看,如果有更好的可以回帖推荐。在我看来大家最多选择两本精读一下就可以了。英文基础好的同学尽量选择英文教材(不是我崇洋媚外,的确是英文教材较好) (1)概率论与数理统计 Gai Lu^ Lun Yu Shu Li Tong Ji / 陈希孺编著 北京 : 科学出版社 合肥 : 中国科学技术大学出版社, 2000 这本教材应该是中科大的工科所用的教材,教材编得很不错,不愧是陈希孺先生编著的。教材只需要微积分和线性代数基础(数学2,3应该都可以了,数学4我不太熟悉),并且讲得也不深,主要涉及比较简单的参数估计、假设检验和线性回归,适合作为入门级的读物。 推荐度:★★★★★(最高五星) 需要基础:★★★(最高五星) (2)数理统计学讲义 Shu Li Tong Ji Xue Jiang Yi / 陈家鼎 ... 编著 北京 : 高等教育出版社, 2006 北大数学科学学院所用的教材,涉及统计的面比较广。课是一学期,但是不会全讲完的。因为是数学系的教材,可能就比较深,需要的基础也就要比较好,要全看懂的话大概需要数学2或以上的水平,如果泛泛而看,应该也不算太难。我学得时候就是感觉这本书上的一些例子很是不错。除了参数估计、假设检验、线性回归之外,这本书还讲了实验设计与方差分析、序贯分析、统计决策、Bayes、抽样调查等,总之就是基本上经典统计的各方面均有所涉及,很推荐,即使数学基础不是很好的同学可以大致浏览一下,很有帮助。 推荐度:★★★★(最高五星) 需要基础:★★★★(最高五星) 可选代替书籍:数理统计学教程 / 陈希孺,倪国熙 编著 上海 : 上海科学技术出版社, 1988 (3)高等数理统计学 / 陈希孺著出版发行 合肥 : 中国科技大学出版社, 1999 这个需要的数学基础就更深了。高等统计基本上是数理统计专业的本科高年级或者研究生的专业课程,需要很强的数学基础,数学3或者数学4的基础基本没必要看了,想读比较应用的统计(大多数同学应该是希望能学统计并且投入应用中去)的同学也不要看了。看这本书最好是学过一学期《数理统计》课程的(不是一学期的《概率论与数理统计》) 推荐度:★★★(最高五星) 需要基础:★★★★★(最高五星) 可选代替书籍:高等数理统计 = Advanced mathematical statistics / 茆诗松,王静龙,濮晓龙编著 北京 : 高等教育出版社 德国 : 施普林格出版社, 1998 (4)Mathematical statistics and data analysis = 数理统计与数据分析 / John A. Rice.Beijing : China Machine Press, 2003. 很不错的一本书,包括几章概率论的内容,只要简单的微积分和线性代数即可,机械工业出版社有影印版。作者内容讲的不深,但是又能让你看到统计的一些思想与精华。而原版教材突出的特点就是善于用例子讲问题,比较容易懂。 推荐度:★★★★(最高五星) 需要基础:★★★(最高五星); (5)Mathematical statistics : basic ideas and selected topics / Peter J. Bickel, Kjell A. Doksum 兰州大学把这本书翻译了:数理统计 shu li tong ji : 基本概念及专题 / P. J. 比克尔, K. A. 道克苏著; 李泽慧, 王嘉澜, 林亨等译, 兰州大学出版社, 2004) 翻译还可以,如果能看懂原版还是看原版吧。强烈推荐这本书。Bickel已是统计界的老前辈了,泰山北斗级的人物,好像是lehhman(不知道有没有写错)的学生,这本教材是我目前见到的最好的数理统计教材了(可能孤陋寡闻了),善于用例子讲问题,并且都是实际中应用的例子,书的逻辑结构也很强,书后的习题有些很有意思的(兰州大学ms出了配套习题书,如果不会可以看看他们怎么做的),每一章会有一些引用的文献,如果对书中某一个东西感兴趣的话,可以看看这些Paper,很长见识。这本书需要的数学基础不是很高,当然看书的深入程度就和数学基础很有关系了。 推荐度:★★★★★(最高五星) 需要基础:★★★★(最高五星) (6)Fundamentals of biostatistics / Bernard Rosner. 中译本:生物统计学基础 Sheng Wu Tong Ji Xue Ji Chu = Fundamentals of biostatistics / (美) 伯纳德·罗斯纳著; 孙尚拱译 eng 北京 : 科学出版社, 2004 生物统计的入门教材。如果以后想做生物统计,或者只是想看看统计的主要内容,可以选择这本书。这本书需要的数学很浅,因为是生物统计,所以例子都是集中在生物统计中的一些实际问题。书附一张光盘,可以自己分析里面的数据。 推荐度:★★★★(最高五星) 需要基础:★★(最高五星) (7)Mathematical statistics / Jun Shao 作者中国人,威斯康星统计系系主任(如果没记错的话)。好像还没有中文版。我们的高等统计课程用的这个教材,基本是和上面(3)一个级别的。适合数学基础比较扎实的同学看,并且需要一定的测度论知识(书第一章讲了,但是不是很多,还是需要看其它书),但是如果读透了会对统计有另一番认识:) 推荐度:★★★★(最高五星) 需要基础:★★★★★(最高五星)
个人分类: 教材学习|7 次阅读|0 个评论
分享 R语言的一个小范例:数值模拟和绘图
accumulation 2015-5-23 01:48
下午上课,要给经济工程专业的本科生简要介绍一下用于统计分析和绘图的R语言。考虑到他们所在的年级并没有系统的学完统计学和计量经济学,打算不从回归分析入手,先教他们对R的基本操作有个了解。写了如下这段代码,准备课上带同学们做一下。顺便发到网上,供大家参考。 背景: 假定Beta 是 一个由alpha(0~1)决定的量,满足关系 问在alpha的取值空间内,Bata值的走势如何,以及最大值出现在什么地方,并绘图说明。 talk is cheap. show me the code (废话少说,放码过来) 一点一点写,并适当做说明 qiu - function(alpha){(alpha / (1-alpha))^{-alpha}} 这段代码的意思是,定义一个名为qiu的function,输入值alpha之后,会自动求得对应的值。比如 qiu(0.67) 0.622206 现在我们来搞alpha。 x - seq(0.001,0.99, by=0.001) 定义一个数组x,取值从0.01开始,每次增加0.001单位,直到0.999。然后看看x这个数组的情况吧 x length(x) 结果就不贴出来了。现在,把x的值交给qiu来处理,生成的一系列值,我们定义为y。 y - qiu(x) 画个草图来看看分布情况如何 plot(y~x) 显然,随着x从0到1, y并不是单调变化的:先增大,后减小。那么,y的最高值是多少?对应的x值是多大? max(y) x 第一行告诉你y的最大值1.3211 第二行的which.max(y)告诉你当y值最大时,所对应的编号是218。把218带入x中,找到对应的x的值:x =0.218 schx=c(x ) schy=c(max(y)) 分别将y值最大时的x和y值,定义为schx和schy,供下文使用。 重新画张图,前面那张太丑了 dev.off() plot(y~x, ylim=c(0,1.5), xlim=c(0,1), type="l", ylab=expression(beta), xlab=expression(alpha)) 第一行dev.off()告诉R的绘图程序,关闭此前的图。第二行的ylim和xlim定义x和y轴的取值范围。type是告诉plot程序,散点图以line的形式呈现。ylab和xlab是x和y轴的名称:由于我们需要使用希腊字母,因此需要使用expression(alpha)和expression(beta)来打出与。 比原来那张图看着帅一些了是吧。继续调整。 par(new=TRUE) plot(max(y)~x , pch=2, lty=3, col="red",ylim=c(0,1.5), xlim=c(0,1), ylab="", xlab="") 第一行告诉绘图程序,我下面要在原有那张图的基础上,继续添加内容,不要覆盖原图。 第二行中,把y最大值时的点标出来,pch表示这个点的形状(1是空心圆,2是空心三角,等等,你们自己试试看从1到20吧)。col="red",将这个点画成红色。ylab和xlab设为空,ylim和xlim和上文的值相同,使得两张图x轴、y轴重合。 差不多行了。如果你想继续和我一样骚包一点的话,跟我向下继续设置。 text(schx, schy-0.2, substitute(paste("(", xx ,", ", yy, ")"), list(xx=schx,yy=schy))) 这行代码的作用是,在途中加入一段文字。语法text(a,b,c)的意思是,a代表横坐标的位置,b代表纵坐标的位置,c代表所需要加入的语言。a和b加在一起,告诉plot()需要把一段文字c放在(a,b)这个地方。 c需要做进一步的说明。"(", 以及 ")", 表示这其中是有纯文字部分的,plot()直接把它们打出来即可(注意逗号是要保留的)。加在两个小括号中间的是xx和yy,这是两个值。 substitute(paste(),list()): substitute()中包括两部分,一部分是paste(),一部分是list()。paste告诉plot()要加入这段东西了,其中包括两个待赋值的xx和yy。list()为它们分别赋值。 看看效果吧。 看起来还可以。要是能把这个式子也写上去就更完美了。 text(0.4, 0.5, substitute( paste(beta == (frac(alpha, 1-alpha))^{-alpha}, ",", "0", alpha, "1") ) ) 收工。这张图看起来还是有些难看。。。。不过基本信息都已经有了。 (来源:中国统计网)
个人分类: 金融学|0 个评论
分享 统计软件
pipiran 2015-5-10 20:19
统计软件的种类很多。有些功能齐全,有些价格便宜;有些容易操作,有些需要更多的实践才能掌握。还有些是专门的软件,只处理某一类统计问题。这里介绍最常见的几种。 1.SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。它也有自己的程序语言,但基本上已经“傻瓜化”。它对于非专业统计工作者是很好的选择。 2.Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。 3.SAS:这是功能非常齐全的软件;价格不菲。尽管现在已经尽量“傻瓜化”,但仍需要一定的训练才可以进入。也可以对它编程;但对于基本统计课程则不那么方便。 4.S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大而又方便的编程功能,使得研究人员可以编制他们的程序来实现其自己创造的理论和方法。 5.R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断在R网站提供统计学家编写的各种最新方法的统计软件包和程序。 6.Minitab:这个软件是很方便的,功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。 7.Statistica:也是功能强大而齐全的“傻瓜化”软件,在我国用的也不如SPSS与SAS那么普遍。 8.Eviews:这是一个处理回归和时间序列等问题很方便的经济计量学软件。 9.GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。 10.FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有许多数学软件包和一些统计软件包。 11.MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计函数不多。 只要学会使用一种“傻瓜式”软件,使用其他的软件也不会困难;最多看看帮助和说明即可。学习软件的最好方式是需要时在使用中学。
个人分类: 软件|0 个评论
分享 统计学
ouyangqi6038 2015-4-14 19:03
应该好好学
0 个评论
分享 统计学爱好者
ttianjing 2015-2-8 12:14
下定决心,学好统计学
1 个评论
分享 拟合优度R2不高怎么办?——请看《经济研究》、《管理世界》
博雅家族 2015-2-3 14:16
R2 (拟合优度)并不高,但计量模型的经济学含义远比统计学意义要更加重要。只要经济学意义正确,虽然是拟合优度不高,但也能说明问题。而且拟合优度常可以通过修正异方差、取对数型等模式改进。 已有研究也有类似情况: 魏下海,董志强,黄玖立:《公会是否改善劳动收入份额?》,《经济研究》, 2013 年第 8 期,第 24-25 页,表 2 、表 3 。 张杰,刘元春,郑文平:《为什么出口会抑制中国企业出口增加值率?》,《管理世界》, 2013 年第 6 期,第 26 页,表 7 。 本人也不懂,就是看到这个上确实有很低的0.145、0.095等情况,所以我想既然这样的顶级期刊上有,是否可以借鉴呢? 请大家讨论下。
0 个评论
分享 生命就是做自己,游戏人生不冒险
esb-livegame 2014-12-29 11:45
了解统计学的都知道,世上最大的风险是 50 、 50 ,也就是说胜负机率各占一半是最大的风险。然而人生和游戏般,避不了生活中重大选择时,轻松面对也能有没真正输赢的人生! 游戏与人生有一项共通的特性,那就是要赢很慢,要输却可以很快,因为有这项特性,所以说判断的时机显得格外重要。而最佳的投资方式,当然是讲求收益率的同时可以降低风险!  如果玩家一直抱持着无法确知结果的情形下进行投资,高的报酬率当然相对地风险也越高,想要摆脱另一种形式的投资须带着﹝知己知彼、百战百胜﹞的精神!更多说明 e世博官网 esb-livegame 都能为你找到解答!
个人分类: 游戏人生|1 次阅读|0 个评论
分享 华章科技:R语言编程艺术
慢爬的蜗牛 2014-11-16 01:52
《华章科技:R语言编程艺术》是R语言领域公认的经典著作,由著名计算机科学家兼统计学家撰写,它是一本面向R语言开发者的纯编程类书籍,不需要读者具备统计学基础,从编程角度而非统计学角度系统讲解了R语言的数据结构、编程结构、语法、TCP/IP网络编程、并行计算、代码调试、程序性能优化、编程技巧以及R语言与其他语言的接口等所有与R编程相关的知识,几乎面面俱到。 《华章科技:R语言编程艺术》的实用性也非常强,44个精选的扩展案例,充分展示了R语言在数据处理和统计分析方面的强大能力。    《华章科技:R语言编程艺术》一共16章: 第1章介绍了学习R语言需要掌握的预备知识以及它的一些重要数据结构; 第2~6章详细讲解了R语言的主要数据结构,包括向量、矩阵、数组、列表、数据框和因子; 第7~13章全面讲解了R语言的语法,包括编程结构、面向对象特性、数学运算与模拟、输入与输出、字符串处理、绘图,以及R语言的调试方法。 第14~16章讲解了R语言编程的高级内容,如执行速度和性能的提升、R语言与C/C++或Python的混合编程,以及R语言的并行计算等。
个人分类: 书籍推荐|0 个评论
分享 数据库构建和数据分析
Alfred_G 2014-7-31 16:01
做基础的数据库构建和数据库分析确实是两种不同的事情。数据库构建要搭平台,C,C++,Java,Pathyon,SQL至少懂得至少一两种方法。但数据分析就是统计学了,其实,无论是stata,SAS,R,凡是用到统计的,也无非就是做描述(频数、频率、分布、离散、集中等),画图,建模,其实也都差不多。话说回来,千里之行,始于足下。继续打基础,好好学吧。面壁勉励自己!
0 个评论
分享 2014年西财统计学考研经验
踏春觅雪 2014-5-17 11:30
2014 年西财统计学考研经验 本人已考上西财统计学学硕,为感谢网上各位前辈的经验和指导,也为后来者提供一点经验,写了一些笼统的建议,里面详细的细节大家还得去搜人家的经验,希望对大家有帮助,再次感谢这个强大的网络方便了我们这一代。 1. 为什么要考研 在决定考研之前,我们一定要确定我们为什么要考研,如果是追随大流或者父母的要求,而不是自己深入分析之后的结果,那么自己会在以后考研路上摇摆不定,浪费实习和找工作的宝贵时间,因此,一定要清楚为什么要考研。 考研的人大概可以分成三种:第一种,有学术追求的人,的确存在这种人,想读研读博,当大学老师。第二种人,本科学校不怎么有名,自己专业的就业竞争压力大(就如我本科是经济学专业,这类的本科生和研究生一大把,好的用人单位一般研究生招聘起步),想读一个好一点的学校容易就业。第三种人,就是不知道为什么要考研,也没有做好就业的心里准备,出于逃避而去考研,有没有很大的考研决心,浑浑噩噩。 所以,考研之前一定要进行分析,考研到底是为了什么,再做决定。 2. 选专业,选学校 如果有自己喜欢的专业,那再好不过,可以先定下专业,然后根据自己的实力和目标院校的上线难易度来决定报考哪所学校。先看一下学校官网看一下自己历年录取情况和招录比,但这也不是绝对的,因为很多人在报考时处于盲目状态,有时候也得看运气。 如果没有喜欢的专业,建议先挑学校,因为学校的好坏决定你以后读研的资源和学习东西的多少。大家可能会犹豫要不要报金融,会计,财政这些热门专业,若果是为了好就业,建议你去国家统计局看一下这些专业的人数和一些机构预测的市场需求,再决定。我当时是认为这些专业的人才太多,竞争压力太大,而统计学,保险这一类的话目前的人才少,未来的市场需求还是蛮大的,前景看好,而西财统计学又是国家重点,资源丰富,就选择了它。记住,热门的不一定好,冷门的不一定差,符合自己,才是最好。 3. 复习计划 很多人会问考过的人在什么什么时间段应该看什么书,怎么看,我认为这很没有必要,因为每个人的学习能力和复习速度是不同的,你问的侧重点应该转移,你需要问清的问题有: 1)所考的专业考那几门,一般数学、英语、政治和专业课,举自己为例,数学我看了李永乐的复习大全,文都汤家凤的讲义,历年真题,模拟卷,英语是新东方的全套资料,有阅读、完形、作文、长难句、历年真题等(个人认为没有张剑那个高教版的好),政治是命题人1000题,风中劲草,历年真题,模拟卷,专业课是西财辅导机构的全套书。知道大概要看多少量的书之后,再根据自己的情况安排时间。 2)时间的安排分两块,一块是读和背的时间比如一天早上一小时,中午一小时,晚上一小时背诵英语政治,另一块是看书和做习题的时间(也包括上课看辅导视频的时间),合理灵活分配。 4.资料 资料其实非常关键,有些人自学能力很强,自己看看书就可以考的很好,有些人的自学能力不怎么好,就如我,我很喜欢听老师讲课,因为我自己看书找不到重点,一箩筐都看,浪费时间,浪费耐心,而且老师有经验,知道重点在哪,知道如何花最短的时间记清和理顺知识点,所以我全程看辅导视频,从基础,强化和冲刺班都听完了,数学全是文都汤家凤的,英语有新东方的和文都何凯文的,政治有蒋中庭和徐之明的。你可以去报班,也可以去网站上收集人家发布的视频。 5. 报名和住宿 报名没什么,到时候和同学一起,知道怎么弄,住宿这一块一定要提醒大家,南昌的高校教室基本没有监控器(其他省市有,可以在自己学校考的,很方便),考试是在市区考,一定要提前找个好房子,不习惯在外面住的最好还是回学校,中午去同学那里蹭着睡一下就好,早晚打个的(我是血淋淋的例子,外面住不习惯,考试两天每天平均睡两个小时,考前是晕的),这里先和大家说一下,有个底。 6. 考完之后 等成绩的这段时间不要荒废,有很大把握的,准备复试,觉得自己没戏的,快点找工作,同时也可以稍作点复试准备,以防万一,千万不要在家享清福。 最后, 在这里 提前祝2015届研友们马到功成,考到自己理想的学校。
2 次阅读|0 个评论
分享 大数据分析与应用案例介绍【转载】
陈默cxx 2014-5-1 11:13
从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪些呢? 1. 可视化分析。 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。 2. 数据挖掘算法。 大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点,也正是因为这些被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法才能更快速的处理大数据,如果一个算法得花上好几年才能得出结论,那大数据的价值也就无从说起了。 3. 预测性分析。 大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。 4. 语义引擎。 非结构化数据的多元化给数据分析带来新的挑战,我们需要一套工具系统的去分析,提炼数据。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。 5.数据质量和数据管理。 大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理,无论是在学术研究还是在商业应用领域,都能够保证分析结果的真实和有价值。 大数据分析的基础就是以上五个方面,当然更加深入大数据分析的话,还有很多很多更加有特点的、更加深入的、更加专业的大数据分析方法。 大数据应用与案例分析 1. 大数据应用案例之:医疗行业 Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。 在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。 它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许未来数年后,它们搜集的数据能让医生给你的诊断变得更为精确,比方说不是通用的成人每日三次一次一片,而是检测到你的血液中药剂已经代谢完成会自动提醒你再次服药。 2. 大数据应用案例之:能源行业 智能电网现在欧洲已经做到了终端,也就是所谓的智能电表。在德国,为了鼓励利用太阳能,会在家庭安装太阳能,除了卖电给你,当你的太阳能有多余电的时候还可以买回来。通过电网收集每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来2~3个月时间里,整个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。因为电有点像期货一样,如果提前买就会比较便宜,买现货就比较贵。通过这个预测后,可以降低采购成本。 维斯塔斯风力系统,依靠的是BigInsights软件和IBM超级计算机,然后对气象数据进行分析,找出安装风力涡轮机和整个风电场最佳的地点。利用大数据,以往需要数周的分析工作,现在仅需要不足1小时便可完成。 3. 大数据应用案例之:通信行业 XO Communications通过使用IBM SPSS预测分析软件,减少了将近一半的客户流失率。XO现在可以预测客户的行为,发现行为趋势,并找出存在缺陷的环节,从而帮助公司及时采取措施,保留客户。此外,IBM新的Netezza网络分析加速器,将通过提供单个端到端网络、服务、客户分析视图的可扩展平台,帮助通信企业制定更科学、合理决策。 电信业者透过数以千万计的客户资料,能分析出多种使用者行为和趋势,卖给需要的企业,这是全新的资料经济。 中国移动通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。 NTT docomo把手机位置信息和互联网上的信息结合起来,为顾客提供附近的餐饮店信息,接近末班车时间时,提供末班车信息服务。 4、大数据应用案例之:零售业 “我们的某个客户,是一家领先的专业时装零售商,通过当地的百货商店、网络及其邮购目录业务为客户提供服务。公司希望向客户提供差异化服务,如何定位公司的差异化,他们通过从 Twitter 和 Facebook 上收集社交信息,更深入的理解化妆品的营销模式,随后他们认识到必须保留两类有价值的客户:高消费者和高影响者。希望通过接受免费化妆服务,让用户进行口碑宣传,这是交易数据与交互数据的完美结合,为业务挑战提供了解决方案。”Informatica的技术帮助这家零售商用社交平台上的数据充实了客户主数据,使他的业务服务更具有目标性。 零售企业也监控客户的店内走动情况以及与商品的互动。它们将这些数据与交易记录相结合来展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。
个人分类: 数据分析|3 次阅读|0 个评论
分享 统计学资料
gl6866 2013-7-27 16:17
找到了Statistics for Managers using Microsoft Excel的资料,可惜是第五版的。现在到了第七版了,估计没什么大区别。
5 次阅读|0 个评论
分享 统计学中RR OR AR HR的区别
Imasasor 2013-7-16 10:44
一、相对危险度( RR ) —— 队列研究中分析暴露因素与发病的关联程度 队列研究是选择暴露及未暴露于某一因素的两组人群,追踪其各自的发病结局,比较两组发病结局的差异,从而判定暴露因素与疾病有无关联及关联大小的一种观察性研究。通常,暴露可以指危险因素,比如吸烟、高血压,也可指服用某种药物。而事件可以是疾病发生,比如肺癌、心血管病,也可指服药后的治疗效果。 RR也叫危险比(risk ratio)或率比(rate ratio),是反映暴露与发病(死亡)关联强度的最有用的指标。 RR 适用于队列研究或随机对照试验。 RR表明暴露组发病或死亡的危险是非暴露组的多少倍。RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。即暴露组发病率或死亡率与非暴露组发病率或死亡率之比。 例题:Doll和Hill从1970年至1974年随访观察英国医生的吸烟情况,得到如下资料:重度吸烟者为160/10万,非吸烟者为8/10万,所有英国医生为80/10万。假设肺癌死亡率可反映肺癌发病率。 RR的计算公式是:RR=暴露组的发病或死亡率/ 非暴露组的发病或死亡率 本例中,与非吸烟者相比,重度吸烟者患肺癌的相对危险度是:RR=160/8=20 相对危险度也叫危险比或率比,是暴露组发病率或死亡率与非暴露组发病率或死亡率之比,它是反映暴露与发病(死亡)关联强度的指标。 当它有统计学意义时: RR=1,说明暴露因素与疾病之间无关联。 RR>1,说明暴露因素是疾病的危险因素(正相关)。认为暴露与疾病呈"正"关联,即暴露因素是疾病的危险因素。   RR<1,说明暴露因素是疾病的保护因素(负相关)。认为暴露与疾病呈"负"关联,即暴露因素是保护因素。 相对危险度应该是指治疗组发生不良反应(adverse outcome)的危险度除以对照组的危险度。(是对照组的多少倍) 前瞻性研究(队列研究) 暴露 非暴露 合计 病例 a b a+b 非病例 c d c+d 合计 a+c b+d N 如上表所示 暴露组的发病率为 π1=a/(a+c) 非暴露组的发病率为 π0=b/(b+d) 相对危险度 RR = π1/π0 = a/(a+c) b/(b+d) 若总体RR大于或小于1,表示暴露因素对疾病有影响。 当其大于1时,表示暴露因素是疾病有害因素,且RR越大,暴露因素对疾病的影响就越大。 当总体RR小于1时,表示暴露因素是疾病的保护性因素,且RR越小,暴露因素对疾病的保护作用就越大。 当总体RR等于1时,表示暴露因素与疾病无关。 在回顾性研究(病例对照研究)中,由于无法计算发病率、死亡率等指标,也就无法计算RR。如下表所示 回顾性研究(病例对照研究) 暴露 非暴露 合计 病例 a b a+b 对照 c d c+d 合计 a+c b+d N 从表中数据可见,在回顾性研究(病例对照研究)中,显然缺乏计算RR的需的基本数据,但是可计算病例组的暴露率和非暴露率之比,即odds1 = P1/(1-P1) = a/(a+b) b/(a+b) ;可以计算对照组的暴露率和非暴露率之比,即odds0 = P0/(1-P0) = c/(c+d) d/(c+d) 。而这两个比数之比即为比值比(Odds Ratio、机会比、优势比)。 OR = P1/(1-P1) P0/(1-P0) = a/(a+b)b/(a+b) c/(c+d)d/(c+d) = ad bc 当所研究疾病的发病率较低时OR近似于RR,故在回顾性研究中可用OR估计RR。OR值的解释与RR相同。 二、归因危险度( AR ) 又叫特异危险度、率差(rate difference, RD)和超额危险度(excess risk), 是暴露组发病率与对照组发病率相差的绝对值,它表示危险特异地归因于暴露因素的程度。 相对危险度指暴露组发病率与非暴露组的发病率之比,它反映了暴露与疾病的关联强度,说明暴露使个体发病的危险比不暴露高多少倍,或者说暴露组的发病危险是非暴露组的多少倍。暴露对疾病的病因学意义较大。 归因危险度指暴露组发病率与非暴露组发病率之差,它反映发病归因于暴露因素的程度,表示暴露可使人群比未暴露时增加的超额发病的数量,如果暴露去除,则可使发病率减少多少(AR的值)。减少暴露对疾病的预防作用较大。 特异危险度(AR)的计算公式是:AR=暴露组的发病或死亡率-非暴露组的发病或死亡率 上例中,每年每十万人由于重度吸烟所至肺癌的特异危险度是:AR=160-8=152 三、 比值比( OR—— 病例对照研究中 暴露因素与疾病的关联强度 比值比(Odds ratio, OR):也称优势比、比数比、交叉乘积比,是病例对照研究中表示暴露与疾病之间关联强度的指标,比值(odds)是指某事物发生的概率与不发生的概率之比。比值比指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。 1 暴露与疾病的危险度增加 正相关 1 暴露与疾病的危险度减少 负相关 =1 暴露与疾病的危险度无关 无相关 成组病例对照研究资料整理表 -------------------- 暴露或特征   病例   对照   合计 --------------------- 有     a      b   a+b=n1 无      c      d   c+d=n0 --------------------- 合计      a+c=m1  b+d=m0  a+b+c+d=N ------------------------ 病例组暴露比值为:(a/m1)/(c/m1)=a/c 对照组暴露比值为:(b/m0)/(d/m0)=b/d 比值比OR= 病例组暴露比值a/c ÷ 对照组暴露比值b/d = ad/bc 相对危险度(relative risk,RR)是暴露组与非暴露组发病率之比。但在病例对照研究中不能计算发病率,只能计算OR,OR的含义与RR相同,是两个概率的比值,指暴露组的疾病危险度为非暴露组的多少倍,取值在0 - ∞之间。当OR1时,说明暴露使疾病的危险度增加,是疾病的危险因素,叫做“正关联”;当OR1时,说明暴露使疾病的危险度减少,叫做“负关联”,暴露因素对疾病有保护作用;当OR=1时,表示暴露与疾病无关联。 OR(odds ratio) 比值比。OR=(A/B)÷(C/D)=AD/BC。RR和OR两个公式的区别,A/(A+B) 指暴露于某因素发生某事件的风险;A/B 指暴露人群中病例的比例,C/D指非暴露人群中病例的比例,所以OR也被称为优势比。当疾病非常罕见时,OR常可作为RR的近似值。 OR通常适用于病例对照研究,也可以运用于前瞻性的研究(当观察时间相等时) 。 Logsitic回归模型可以得到OR值。 计算OR的可信限 由于比值比是对暴露和疾病联系强度的一个点估计值,此估计值未考虑抽样误差,有其变异性,计算出这个变异区间有助于进一步了解联系的性质和强度,即按一定的概率(可信度)来估计本次研究总体的比值比在什么范围内,这个范围称比值比的的可信区间,其上下限的数值为可信限。一般采用95%的可信限。计算OR值可信区间除了有助于估计变异范围的大小外,还有助于检验OR值的判断意义,如区间跨越1,则暴露与疾病无关联。 例1:Doll和Hill在1950年报告吸烟与肺癌关系的病例对照研究,结果如表 表1 吸烟与肺癌关系的病例对照研究资料 ----------------- - ` 吸烟史  病例  对照  合计 --------------- 有    688   650  1338 无    21    59  80 --------------- 合计   709   709  1418 ----------------- - ① χ2检验 P0.001,两组的暴露史比例差异显著,提示吸烟可能与肺癌有联系。 ② 计算比值比OR OR=688×59/650×21=2.97 ③ 计算OR 95%可信限 故OR95%可信限为1.83-4.90。即总体的OR值有95%的把握在此范围内,分析结果说明吸烟对肺癌高度有害,说明吸烟者(暴露)患肺癌的的危险性为不吸烟者(非暴露)的1.83-4.90倍。 风险比(hazard ratio, HR )[ HR =暴露组的风险函数h1(t)/非暴露组的风险函数h2(t),t指在相同的时间点上]。而风险函数指危险率函数、条件死亡率、瞬时死亡率。 Cox比例风险模型可以得到HR。资料的类型通常是临床治疗性研究,也可以是流行病学的队列观察性研究。 风险比和危害比。 1、多数认为HR与RR意思一样,但HR有时间因素在内,换句话说,包含了时间效应的RR就是HR; 2、可以这样理解,生存资料中,RR考虑了终点事件的差异,而HR不仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据; 3、根据Parmar的文章,HR=(Or/Oe)/(Cr/Ce),O和C分别代表对照组和试验组,r代表实际发生事件的人数,e代表按log rank test中计算得出的理论上应该发生事件的人数。其实HR的计算还有一种方法就是 {nextpage} *** this is assumed based on the constancy of the ratio over time, as above. 对于提供生存率的文献,可以根据公式HR= / ,其中p0为对照组的5年生存率,p1为暴露组的5年生存率。 *** Hazard is an instaneous rate of a given outcome, which indeed factors time in. Hazard ratio is a raio of two hazards (Exp/Ctl) at that given time. By using hazard ratio as a summary estimate of the treatment effects in suvival data, we assume the hazard ratio is constant over time, which is a strong assumption and a basis for cox regression. This doesn't mean hazard would not change (actually, hazard always change over time), though - we just require the ratio of the hazards is constant. 3、根据Parmar的文章,HR=(Or/Oe)/(Cr/Ce),O和C分别代表对照组和试验组,r代表实际发生事件的人数,e代表按log rank test中计算得出的理论上应该发生事件的人数。
1 次阅读|0 个评论
分享 2013-06-23
午后,阳光 2013-6-23 20:33
统计学(金融统计与风险管理)要考什么证,充实自己,以后更好找工作呢?
0 个评论
分享 统计学
l650483126 2012-12-30 10:49
很好嘛
3 次阅读|0 个评论
分享 统计学
l650483126 2012-12-27 12:02
好学吗
0 个评论
分享 学习统计学的道路任重而道远
vivian~` 2012-11-27 17:09
统计学是一门难学的课,但是上课好好听讲再加自己课后努力学习的话,我相信也能够学好统计学。当然,我们现在所学习的统计学的程度还是属于低层次的,但是类,一步一个脚印嘛。。。先打好基础,才能攀登科学的顶峰呗。 学习统计学的道路任重而道远。。。加油加油。。。
个人分类: 学习感想|3 次阅读|0 个评论
分享 统计学知识重要
熊肉 2012-10-8 17:48
统计学知识重要
个人分类: 闲逛|3 次阅读|1 个评论
分享 统计学中的T检验、P值是什么意思
gaofeitian 2012-8-29 21:45
在回归分析中,t检验就是对回归参数的显著性进行检验;f检验是对回归方程的显著性进行检验。在一元回归中,二者是等价的;在多元回归中,t检验通过则f检验一定能够通过,而f检验通过t检验不一定通过。p值就是方便大家判断显著性的,一般软件运行结果中都有,例如在a=0.05时,P0.05,就拒绝原假设,说明显著!
0 个评论
分享 统计学小故事-----战斗机的护甲
abei1987 2012-6-3 15:11
二战前期,德国和英国的战斗机互相对对方国进行狂轰滥炸,每天都有部分的战斗机毁灭,也有部分战斗机负伤返回。于是,英国的飞机设计师想给飞机安装护甲,但是不知道护甲应该安装在飞机的什么部位最好。哈,此时,统计学家出场了,统计学家收集来那些中弹后依然安全返航的飞机,然后把这些飞机的中弹部位描绘在图纸上,最后把所有的这些飞机的图纸叠在一起,就形成了一张弹孔密度分布图。统计学家很确信的说:没有中弹的部位就是需要安装护甲的地方,因为其他部位中弹后飞机依然能够安全返回! 这个小故事让我了解到了统计学家不是一无是处的,哈哈哈哈。
个人分类: 小故事|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-12-10 11:33