楼主: 葛新龙
1851 0

统计学发展概况 [推广有奖]

  • 8关注
  • 40粉丝

已卖:1757份资源

学科带头人

29%

还不是VIP/贵宾

-

威望
1
论坛币
614 个
通用积分
66.8598
学术水平
53 点
热心指数
62 点
信用等级
44 点
经验
228 点
帖子
695
精华
1
在线时间
2647 小时
注册时间
2009-10-15
最后登录
2026-1-2

楼主
葛新龙 学生认证  发表于 2009-11-20 13:06:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
统计学发展概况(2)(二)高斯的主要贡献
1、建立最小二乘法在学生时代,高斯就开始了最小二乘法的研究。1794年,他读了数学家兰伯特(J.H. Lambert,1728~1777)的作品,讨论如何运用平均数法,从观察值(Yi ,xi)中确定线性关系Y=α+βx中的二个系数。1795年,设想了以残差平方和Σ(Yi -a-bxi )2为最小的情况下,求得的ab来估计α与β。1798年完成最小二乘法的整个思考结构,正式发表于1809年。
2、发现高斯分布 调查、观察或测量中的误差,不仅是不可避免的,而且一般是无法把握的。高斯以他丰富的天文观察和在1821~1825年间土地测量的经验,发现观察值x与真正值μ的误差变异,大量服从现代人们最熟悉的正态分布。他运用极大似然法及其他数学知识,推导出测量误差的概率分布公式。“误差分布曲线”这个术语就是高斯提出来的,后人为了纪念他,称这分布曲线为高斯分布曲线,也就是今天的正态分布曲线。高斯所发现的一般误差概率分布曲线以及据此来测定天文观察误差的方法,不仅在理论上,而且在应用上都有极重要的意义。

二、近代描述统计学
近代描述统计学形成期间大致在十九世纪中叶至二十世纪上半叶。由于这种“描述”特色由一批原是研究生物进化的学者们提炼而成,因此历史上称他们为生物统计学派。生物统计学派的创始人是英国的高尔登(F. Galton,1822~1911),主将是高尔登的学生毕尔生(K.Pearson,1857~1936)。
(一) 高尔登的主要贡献
1、初创生物统计学为了研究人类智能的遗传问题,高尔登仔细地阅读了三百多人的传记,以初步确定这些人中间多少人有亲属关系以及关系的大致密切程度。然后再从一组组知名人士中分别考察,以便从总体上来了解智力遗传的规律性。为了获得更多人的特性和能力的统计资料,高尔登自1882年起开设“人体测量实验室”。在连续六年中,共测量了9337人的“身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、色觉及个人的其它资料”,他深入钻研那些资料中隐藏着的内在联系,最终得出“祖先遗传法则”。他努力探索那些能把大量数据加以描述与比较的方法和途径,引入了中位数、百分位数、四分位数、四分位差以及分布、相关、回归等重要的统计学概念与方法。1901年,高尔登及其学生毕尔生在为《生物计量学》(Biometrika)杂志所写的创刊词中,首次为他们所运用的统计方法论明确提出了“生物统计”(Biometry)一词。高尔登解释道:“所谓生物统计学,是应用于生物学科中的现代统计方法”。从高尔登及后续者的研究实践来看,他们把生物统计学看作为一种应用统计学,其研究范围,既用统计方法来研究生物科学中的问题,更主要的是发展在生物科学应用中的统计方法本身。
2、对统计学的贡献
(1) 关于变异变异是进化论中的重要概念,高尔登首次以统计方法加以处理,最终导致了英国生物统计学派的创立。1889年,高尔登把总体的定量测定法引入遗传研究中。高尔登通过总体测量发现,对对象或植物的每一个种别都可以决定一个平均类型。在一个种别中,所有个体都围绕着这个平均类型,并把它当作轴心向多方面变异。这就是他在《遗传的天赋》一书中提出的“平均数离差法则”。
(2)关于“相关”统计相关法是由高尔登创造的。关于相关研究的起因,最早是他因度量甜豌豆的大小,觉察到子代在遗传后有“返于中亲”的现象。1877年他搜集大量人体身长数据后,计算分析高个子父母、矮个子父母以及一高一矮父母的后代各有多少个高个子和矮个子子女,从而把父母高的后代高个子比较多、父母矮的其后代高个子比较少这一定性认识具体化为父母与子女之间在身长方面的定量关系。1888年,高尔登在“相关及其主要来自人体的度量”一文中,充分论述了“相关”的统计意义,并提出了高尔登相关函数(即现在常用的相关系数)的计算公式。
⑶ 关于“回归”1870年,高尔登在研究人类身长的遗传时发现:高个子父母的子女,其身长有低于他们父母身长的趋势;相反,矮个子父母的子女,其身长却往往有高于他们父母身长的趋势,从人口全局来看,高个子的人“回归”于一般人身长的期望值,而矮个子的人则作相反的“回归”。这是统计学上“回归”的最初涵义。1886年,高尔登在论文“在遗传的身长中向中等身长的回归”中,正式提出了“回归”概念。
(二)毕尔生的主要贡献
对生物统计学倾注心血,并把它上升到通用方法论高度的是毕尔生。毕尔生的一生是统计研究的一生,他对统计学的主要贡献有:
1、变异数据的处理 生物统计中所取得的数据常常是零乱的,很难看出其所以然。为此,毕尔生首先探求处理数据的方法,他所首创的频数分布表与频数分布图如今已成为统计方法中最基本的手段之一。
2、分布曲线的选配十九世纪以前,人们认为以频数分布描述变异值,最终都表现为正态分布曲线。但是,毕尔生从生物统计资料的经验分布中,注意到许多生物上的度量不具有正态分布,而常常呈偏态分布,甚至倾斜度很大;也不一定都是单峰,也有非单峰的。说明“唯正态”信念并不可靠。1894年,他在“关于不对称频率曲线的分解”一文中首先把非对称的观察曲线分解为几个正态曲线。他利用所谓“相对斜率”的方法得到12种分布函数型,其中包括正态分布、矩形分布、J型分布、U型分布或铃型分布等。后来经R. 费雪的进一步研究,毕尔生分布曲线中第Ⅰ、Ⅱ、Ⅲ、Ⅳ及Ⅶ型出现在小样本理论内。尽管,毕尔生的曲线体系的推导方法是缺乏理论基础的,但也给人们不少启迪。
3、卡方检验的提出1900年毕尔生独立地又重新发现了 分布,并提出了有名的“卡方检验法”(Test of )。毕尔生获得了统计量:=∑(实际次数-理论次数)2 /理论次数,并证明了当观察次数充分大时,总是近似地服从自由度为(k-1)的分布,其中k表示所划分的组数。在自然现象的范围内,检验法运用得很广泛。后经R. 费雪补充,成为了小样本推断统计的早期方法之一。
4、回归与相关的发展 回归与相关,经毕尔生进一步作了发展后,这两个出自于生物统计学领域的概念,便被推广为一般统计方法论的重要概念。 1896年,他在“进化论的数理研究: 回归、遗传和随机交配”一文中得出至今仍被广泛使用的线性相关计算公式:。毕尔生还得出回归方程式:abx (其中ab根据最小二乘法计算获得),以及回归系数的计算公式:当yx而变时∑(x)(y)/∑(x)2;当xy而变时,∑(x-)(y-)/∑(y-)2。此外,在1897~1905年,毕尔生还提出复相关、总相关、相关比等概念,不仅发展了高尔登的相关理论,还为之建立了数学基础。

三、现代推断统计学
现代推断统计学形成期间大致是二十世纪初叶至二十世纪中叶。人类历史进入二十世纪后,无论社会领域还是自然领域都向统计学提出更多的要求。各种事物与现象之间繁杂的数量关系以及一系列未知的数量变化,单靠记录或描述的统计方法已难以奏效。因此,相继产生“推断”的方法来掌握事物总体的真正联系以及预测未来的发展。从描述统计学到推断统计学,这是统计发展过程中的一个大飞跃。统计学发展中的这场深刻变革是在农业田间试验领域中完成的。因此,历史上称之为农业试验学派。对现代推断统计的建立贡献最大的是英国统计学家哥塞特(W.S. Gosset,1876~1937)和费雪(R.A. Fisher,1890~1962)。
(一) 哥塞特的t检验与小样本思想
1908年,哥塞特首次以“学生”(Student)为笔名,在《生物计量学》杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。后来,哥塞特又连续发表了“相关系数的概率误差”(1909)、“非随机抽样的样本平均数分布”(1909)、“从无限总体随机抽样平均数的概率估算表”(1917),等等。他在这些论文中,第一,比较了平均误差与标准误差的两种计算方法;第二,研究了泊松分布应用中的样本误差问题;第三,建立了相关系数的抽样分布;第四,导入了“学生”分布,即t分布。这些论文的完成,为“小样本理论”奠定了基础;同时,也为以后的样本资料的统计分析与解释开创了一条崭新的路子。由于哥塞特开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把哥塞特推崇为推断统计学的先驱者。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:发展概况 统计学 Biometrika pearson Lambert 发展 统计学 概况

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 13:34