費雪還有很多其他的貢獻,早先我們曾提到他介紹了一樣本統計量是否為一個群體參數的好估計量的判定準則,包括了一致性,效率性和充足性等概念就是在1921年一篇重要文獻中提到的。在這類文章中,他還曾介紹最概估計量 (maximum likelihood estimation) 的觀念。
1919年費氏離開他在中學教數學的工作,轉至羅森斯得農業試驗站 (Rothamsted Agricultural Experimental station),在這裏他發展出現在世界通用的抽樣技巧和隨機程序。他的兩本名著《Statistical Methods for Research Workers》和《Design of Experiments》分別於1925年和1935年出版,對於統計有重大的影響。後者的第二章曾列入《數學世界》 註5,在這篇非常引人入勝的文章中,費氏提到有一位女士聲稱她能分辨出她的茶中牛奶是在泡茶之前或之後加入的,而後他描述一種實驗計劃來證明或否定該女士的聲稱。
為了想答覆關於群體的問題,由實用的觀點來看,我們必須由群體中選取樣本,然後依據樣本所提供的資訊推論母體。母體所涉及的如母體均值 μ 和標準差 σ 都是未知,假設有一個樣本被很適當地選出(如何選法是一個很重要的統計問題),依據樣本可以得出相當好的母體參數或某量的估計值。早先我們曾提到費雪提出母體參數的好樣本統計量的判別準則,我們只是很簡要的提出,假若 (x1,,xn) 代表一組由母體均值為 μ、標準差為 σ 的群體中選取的樣本,則分別定義如下的樣本平均數 和樣本標準差 S。
用這些統計量以估計 μ 及 σ,會滿足費雪所訂的大部份準則 註6。
如果我們由一個群體取出很多組樣本,並且每組均計算 值,我們就可得到很多不同的數值,而這些數值會趨於接近群體平均數 μ。這樣看來, 也是一個變數呈某種形式分佈,這就引起了一個重要問題:若已知群體變數為某種分配,則樣本平均數又如何分配?下述定理,我們僅敘述而不證明,可回答部份這個問題。
定理:若母體變數的分佈函數為平均數 μ 和標準差 σ 的常態分配,則樣本平均值 亦為常態分配,其平均數為 μ,標準差 ,n 為樣本大小。
回想標準差的重要性,我們的結論是當樣本大小越大,則 值接近 μ 的機率也愈大,如圖五所示。在應用這個定理時,受到一個嚴格的限制,因為實際上的任何群體是否確實為常態分配很可懷疑。有很多群體變數甚至不近似常態分配,但有一個在機率論上最著名的定理,也是在所有數學中最著名的定理之一可以部分幫助解決這個問題是中央極限定理,其中一種形式敘述如下:
定理:若一母體變數不論其分配如何,只要有平均數 μ 和一標準差 σ,則 約近似為平均數為 μ 和標準差 的常態分配,而且當樣本數 n 越大時, 的分佈越近似常態分配。
中央極限定理有一段相當長的發展史,1773年棣美弗證明其第一種形式即考慮擲硬幣只有兩種可能出現的情形,我們在前面所說的形式是1922年凌德柏 (J.W.Lindeberg) 所述 註7 。近來俄國數學家甚至給出 以常態分配為其極限分配的充要條件,把本定理推廣至其極致。為了顯示統計學家對中央極限定理的用法,我們來看由霍爾 (Paul G. Hoel) 編著的統計教本 註8 中的一個典型問題「某細繩製油商由過去的經驗發覺某種細繩的平均耐拉力為15.6磅,標準差為2.2,現試將這種細繩的製造過程時間縮短,而後取50條細繩為樣本做試驗。結果發現其平均耐拉力減為14.5磅,試問依據這個樣本,是否應下結論為「新製造程序對繩子拉力有壞的影響?」」
--------------------------------------------------------------------------------
圖五
統計人員稱這種問題為假說檢定,我們必須檢定假說 對 ,雖然製造程序改變,標準差也很可能改變,但是我們仍假設耐拉力 X 的標準差為2.2磅,現在我們用到了中央極限定理,不論 X 如何分配, 為平均數 μ 和標準差 的近似常態分配,或者說 為平均數 0 和標準差 1 的標準常態分配。然後我們查數值表,發現 遠離15.6,如果假說 H0 成立的話, 的機率僅0.0002,因此我們棄卻 H0 而接受 H1。依照通常在 H0 成立的假說下, 值出現的機率僅0.05時即棄卻 H0 的原則,由數表可知當 小於15.09,我們就應判定棄卻 H0,任意小於15.09的數值稱為在臨界區域。
--------------------------------------------------------------------------------
圖六
我們再回頭提一下假設新製程的標準差 σ 不變的誤差機率。事實上,這時 σ 已不是一個已知數,但是我們可以計算出樣本標準差 S,在1908年化學家高塞特(William Gosset)以 Student 的筆名發表他發現的統計量 (注意 σ 被 S 取代)的分配,他指出若 X 為常態分配,則 t 為自由度 n-1 的 student t 分配,這種分配相當重要,其分配數值在一般統計數表中均有列出。雖然高塞特於1908年發現 t 分配,但是他的結果只是一種猜測,直到1926年才由費雪加以嚴密的證明。在此 X 為常態分配這條件非常緊要,但是即使 X 僅為近似常態分配,統計學家發現當 σ 為未知,尤其是當樣本數 n 值很小時,非常適宜採用 t 分配。當 n 相當大時,S 和 σ 的差別越來越小,因此不太需要使用 t 分配數值表。
第三個時期以為在1928年聶曼(Jerzy Neyman)和伊根.皮爾遜(Egon Pearson, 卡爾.皮爾遜之子)的共同論文多篇的發表為開端,這些論文介紹和強調諸如驗定問題中的第二種錯誤,檢驗的檢定力和信賴區間之類的觀念。在這期間,工業界開始大量採用統計技巧,尤其是與品質管制有關的統計。並且由於人們對調查工作的感興趣導向對抽樣理論與技巧的研究,1928年聶曼和伊根.皮爾遜的論文為檢定與估計理論帶來一種嶄新的面貌。包括對許多費雪早先提出的想法的重新加以整理和修正,例如在細繩製造商的問題中,我們早先得到的結論是:若一樣本的樣本平均數值小於15.09則棄卻假說 H0。聶曼和皮爾遜提出如下之類的問題:為什麼我們要設15.09以左為臨界域?為什麼不取0.025在分配曲線極左的面積和0.25在分配曲線極右的面積成「雙尾」(two tailed) 臨界區域?
--------------------------------------------------------------------------------
圖七
於選取臨界域時必須採何種準則?我們必須要用直覺還是用嚴謹的數學?我們得到如圖八的結論牽涉到兩種不同型態的錯誤,聶曼和皮爾遜命名為第一種錯誤和第二種錯誤。聶曼和皮爾遜總結他們的發現歸納成為下述原則:在所有具有相同第一種錯誤的試驗(臨界域)中,我們選用具最小第二種錯誤的臨界域。
H0為真 H1為真
接受H0 正確決定 第二種錯誤
接受H1 第一種錯誤 正確決定
圖八
雖然本原則的應用相當複雜,聶曼和皮爾遜的影響使本原則及其相關的檢定力函數成為重要的統計概念,並且發展出討論這類問題的一般數學理論。
談現代統計學的發展,實不能不提華德(Abraham Wald, 1902~1950) 註9 ,否則必定顯得不完備。華德的第一篇論文關於目前常見的統計程序──逐次抽樣 (sequential sampling) 的出現第四時期的開始。這篇1939年的論文是華德一連串論文的起始,不幸正當他的創新力處於顛峰時卻由於飛機失事死於非命。華德最大的貢獻之一是他介紹一種對統計問題的新看法(1945),那就是以對局的觀點去處理統計方面的問題,這就是今日所稱的統計決策理論 (statistical dicision theory)。從這個觀點,統計被視為以自然為對手的對局的藝術,這是一個相當廣義的理論,雖然它牽涉到相當複雜的數學,但是平心而論,我們可以說大部分目前的統計研究人員發現採用這種新觀點非常理想。華德對統計理論發展的方向有重大的影響,他的「門徒」們多成為今日統計界的領袖人物。
華德誕生在羅馬尼亞,是正統的 (orthodox) 猶太世家,由於它的宗教信仰,使他受教育的機會受到某些限制,而必須靠自修彌補。他自修的結果竟能對希爾伯特 (Hilbert) 的《Foundation of Geometry》提出有價值的見解,他的建議列入該書的第七版中,這一事實充分顯示了他的數學天賦。後來華德進入維也納大學並且在僅修了三門課之後就得到博士學位。在這個時期的奧地利,由於政治上的因素使他無法從事學術工作,只好接受一個私人職位,職責是幫助一位銀行家增廣高等數學知識,他因此對經濟學深感興趣,後來成為經濟學家摩根斯坦 (Oskar Morgenstern) 的親信助理。摩氏曾與馮紐曼 (John Von Neumann) 共同合作從事研究並奠定了對局論 (game theory) 的基礎。
華德在二次大戰前到達美國,他的父母和姊妹不幸沒有逃出來,結果死於納粹的瓦斯房。華德由於對經濟學的興趣接觸到統計學,逐漸轉向從事統計學的研究,不久竟成為一位傑出的理論統計學家。除了統計決策理論之外,華德對統計還有很多重要的貢獻,在此我們提出主要的一個,就是逐次分析。雖然這個理論可能不是他所首創,但卻是他發展完成的(1943)。這個技巧在減少生產製程中的抽樣數方面非常重要,二次大戰期間曾被列為機密。
現在我們以工業方面的品質管制問題為例來說明逐次分析的觀念,在逐次方法未發表之前,標準的抽樣程序是由製成品中抽取定量的樣本,然後依據樣本中所含不良品數的多寡判定允收或拒收該批。這種程序忽略了關於製成品批的優劣資訊可由在抽樣過程中不良品出現率的大小獲得的事實。
在逐次抽樣中,我們把抽樣過程中可能發生的狀況分為三類:
(1)大量不良品連續出現導致立即判定拒收該批
(2)大量良品連續出現,導致立即判定允收該批
(3)缺乏結論性的證據,因此必須繼續抽樣,圖九是一個實例。
--------------------------------------------------------------------------------
圖九:這次抽樣
這三個區域的劃分準則視所允許的第一種錯誤和第二種錯誤而定。在本例中,在查驗第六十個製成品後才判定允收。
由圖形中可見,這種抽樣方法可能很快就能決定是否允收,也可能在中間區域停留很久的時間,但是華德證明允收或拒收的決定能於有限步內達成的機率為1,實際經驗顯示逐次抽樣和傳統的固定樣本大小的程序相比在抽樣費用方面約可節省一半。
除了上述四大統計思潮外,1933年俄國數學家柯摩哥羅夫 (Kolmogorov) 發表《Foundation of the theory of probability》為統計學理論奠定了邏輯基礎。在統計應用技巧方面,電子計算機的發展和使用是一大革命。十九世紀末葉開始,美國人口調查局 (U.S. Census Bureau) 每十年舉辦一次人口普查,後來,由於人口的漸增,人口調查局發現他們已越來越無法處理所蒐集的成堆數據。賀爾瑞茲 (Herman Hollerith) 想出許多利用打孔卡片 (punched card) 記錄數據的方法,並且發明機械能讀這些數據和處置資訊 (Information),在賀氏的指導下,1894年人口調查局的工作利用打孔卡和讀卡機,提高不少效率。雖然1890年人口調查時,美國人口比1880年增多了約百分之二十五,但是工作完成所費的時間卻僅為其三分之一。
電子計算機於二次大戰後發展一日千里,1950年後漸進入實用階段。計算機的出現不但使統計計算工作簡化,而且快捷。尤其是有了統計成套程式 (Statistical package) 以後,更為方便,只要知道應採用何種統計方法就能使用。1972年惠普 (Heweleit Packard) 公司發展出掌上型計算器 (calculator),對於一般小統計問題的解決,更是方便,不必因為統計問題特地到計算機中心去。
統計為一科學方法,其可應用範圍,遍及自然科學及社會科學的整個領域中的許多部分,大凡農業、工業、商業、教育、醫藥、政治、社會、經濟等等許多問題無不適合採用統計方法處理,統計學傳入我國雖已有相當時日,但是我國目前還只有政府機關較為重視,民間工商企業近年來雖然也漸漸講求科學管理,但是大多未能應用統計方法。
1. Dale E.Varbery 《The development of modern statistics》 Part I, II, The Mathematics Teacher April 1963 p.252-257 May 1963 p.44-348.
2. Mario F.Triola 《Mathematics and the modern world》 Cummings Publishing Company, 1973.


雷达卡
京公网安备 11010802022788号







