三、关于阅读的几条建议
从上面的介绍我们知道,Frontiers in Statistics是很值得仔细阅读的。为了读好它,本文提出以下几点建议供读者参考。首先,因为协方差矩阵已渗入自然科学、人文科学的各个方面⑦,所以我们应该熟悉有关的矩阵计算,特别是“稀疏协方差矩阵”的估计和计算。
其次,综述性的学术文献一般较长(一篇这样的文章包含上万个单词是很常见的),这需要读者具有足够的耐心,而对这种文献在行文中所提及的另外一篇(或另外几篇)重要文献,读者也应有能力跟踪。例如,第2章认为“半参数”这一术语最早出现在Gail等于1980年“Biometrics”(生物计量学)发表的论文,而为了深入讨论这一专题,又必须对半参数与非参数模型作出对比。限于篇幅,第2章没有详细展开这种对比而是在末尾处提供了若干参考文献供读者进一步追踪:其中一篇特别重要的综述由Bickel与Ritov合写⑧,它详细阐述了半参数与非参数模型的历史发展、取得的成果及需要更深入研究的课题。显然,不读Bickel与Ritov的这篇文章会有许多损失。
Bickel与Ritov的文章精彩迭出,现试举一例作简要说明。在谈及半参数模型的历史发展时,Bickel与Ritov写到:
“Semiparametric statistics arose primarily from three main fields of applications: biostatistics and reliability, where censored and truncated data first came to the fore and in 1958 and the Kaplan-Meier estimate first appeared; sample surveys and census, where biased and stratified samples and the Horvitz-Thompson estimate appeared; and econometric models where all of these types of data presented themselves. Founding figures in these fields were Neyman, Hartley and Hajek in sampling, Kaplan and Meier in survival analysis, and Rasch and others in econometric modeling. Theoretical development through the theory of point processes came into survival analysis in the work of Aalen (1978a, b). More generally, decision theoretic asymptotic optimality in these models was developed in the work of Levit (1978), and Ibragimov and Has' minskii(1982). Pfanzagl (1982) and subsequently Bickel et al. (1993) developed in a systematic way estimation for regular parameters in models of this type. Results for inference in particular models appear continuously. The emphasis is on estimation, testing and confidence intervals for regular parameters, with convergence playing a central role. It appears, we believe correctly, that this area is a fairly direct descendant of the pre 1975 nonparametric statistics, e.g., the rank tests of Hajek (1962) Gehan (1965), starting with van Eeden (1970).”
这一段主要告诉我们,半参数统计学肇始于统计学在下述3个方面的应用,即生物统计和可靠性统计(Kaplan和Meier于1958年首次对删截型数据给出统计分析);统计调查及人口普查(有偏样本和分层抽样样本出现,Horvitz和Thompson估计问世);计量经济学模型(在这种模型中所有类型的数据都能出现)。Neyman,Hartley及Hajek在抽样技术方面,Kaplan和Meier在生存分析方面,Rasch等人在计量经济学模型方面均有建树。在理论发展方面,Aalen将点过程引入生存分析是一个重大突破(1978),更具普遍意义的是Levit(1978),Ibragimov及Has'minskii(1982)的工作,他们发展了判决理论的渐进优化方法。此后,Pfanzagl(1982)和Bickel等人(1993)关于具有正规参数的模型又发展出系统的估计方法。有关这些统计问题的研究结果层出不穷,重点无外乎涉及具有正规参数(模型的)估计(含区间估计)及假设检验,而以 速率收敛在这些统计分析中发挥了中心作用。Bickel与Ritov认为这些工作都是1975年以前的非参数统计学(如秩检验)的继续。
再其次,我们应采取循序渐进的阅读策略,整本书读起来有困难就先读懂一章,一章有困难就先读懂一节,一节有困难就先读懂一个定理,总之,要稳扎稳打、步步为营,就怕起步起不来。切忌囫囵吞枣,似懂非懂⑨。
最后,读者还应具备一定的动态对等翻译能力⑩。因为在阅读专业文献时,我们时常需要逐字逐句地将外语文献译成汉语,以便精确理解它。
注释:
①范剑青,福建莆田人,1982年毕业于复旦大学数学系,随后考入中国科学院应用数学所攻读硕士学位,师从方开泰教授,1986年进入美国加州大学伯克利分校攻读博士学位,师从Bickel教授和Donoho教授,1989年以优异的成绩提前毕业。现为美国普林斯顿大学统计与金融工程终身教授,The Annalsof Statistics杂志主编,2000年COPSS奖得主,在非参数建模、非线性时间序列、生物统计、广义线性模型、小波、计量金融与风险管理等方面均做出重大贡献。
②由于各种原因,在民意调查、市场调研、社会经济调查、医学及其他科学试验等方面,普遍存在数据丢失或数据不全的现象,因此,缺失数据模型近年来受到极大的关注,亟待深入研究。
③本节主要取材于Frontiers in Statistics前言,为方便读者理解,本节对有关内容添加了注释。
④对于一组不完全数据 ,i=1,2,…,n,若全部 均被观测到而 缺失,则 ,反之, (即 未缺失)。MAR意指给定Y及Z时,δ与X条件独立。
⑤交叉核实的基本思想是留下一个数据点作为模型的核实数据,而用其他所有的数据点来建立模型。
⑥伊辛模型(the Ising model)是德国学者Ising提出的最简单的描述无限多个相互作用的自旋物理模型。晶格的每个格点上占据一个有向上、向下两个可能状态的自旋,它们与其最近邻自旋间有相互作用。相互作用会使最近邻自旋的排列方向一致,因此在绝对零度所有自旋的取向将会完全一致。该模型具有丰富的物理内容,例如,它可以描述液体的冻结和蒸发等相变现象,也可以研究连续的量子相变、动力学临界行为等。1925年,Ising本人得到一维伊辛模型的精确解。1944年,美国物理学家Onsager获得二维伊辛模型的精确解,被视为统计物理学上的一项重大进展。但迄今尚无被学术界公认的三维伊辛模型精确解。
⑦范剑青,工作论文.High-dimensional Covariance Learning. Wuhan University. June 20, 2008.
⑧Non and semi-parametric statistics: Compared and contrasted by Bickel and Ritov. Journal of Statistical Planning and Inference 91 (2000) 209-228.
⑨这是张尧庭先生生前对我们的谆谆教导。
⑩“Dynamic Equivalent Translation”“(动态对等翻译”)是美国著名语言学家Eugene A.Nida于20世纪60年代提出的一种全新的翻译理念。他坚持认为任何能用一种语言表达的东西,都能够用另外一种语言来表达;语言之间、文化之间能够通过寻找翻译对等语,以恰当方式重新组织信息的形式和语义结构而进行交际。Eugene A.Nida的“动态对等翻译”被公认为是对传统翻译理论和方法的重大突破。
【参考文献】
[1]范剑青,姚琦伟著.陈敏译.非线性时间序列——建模、预报及应用[M].高等教育出版社.北京.2005.153-272.
[2]范剑青.High-dimensionalCovariance Learning.工作论文.Wuhan University. June 20, 2008.
[3]张尧庭,方开泰著.多元统计分析引论[M].科学出版社.北京.1982.119-249.
[4][美]Peter J.Bickel, Kjell A. Doksum著.Mathematical Statistics: Basic Ideas & Selected Topics[M].中国统计出版社.北京.2004.
[5]史宁中著.统计检验的理论与方法[M].科学出版社.北京.2008.53-93.
[6]谭载喜编译.奈达论翻译[C].中国对外翻译出版公司.北京,1984.
[7][美]Eugene A.Nida, Jin Di著.On Translation[M].中国对外翻译出版公司.北京.1984.
【原文出处】《统计研究》(京)2009年9期第108~112页
【作者简介】龚凤乾,男,天津市人,天津财经大学统计系副教授,经济学博士,研究方向为统计学与风险管理(天津 300204)
P.S. 这本书真的很好,所以推荐大家看一下~O(∩_∩)O~