签到
苹果/安卓/wp
苹果/安卓/wp
客户端
0.0
0.00
推广加币
数据VIP
升级SVIP
注册
|
登录
项目交易
CDA数据分析师
CDA网校
CDA社区
CDA认证考试
CDA俱乐部
CDA Live
在线教育
JG学术培训
经管云课堂
CDA网校
CDA数据分析研究院
统计软件培训
金融科技
就学培训网
经管题库
培训证书查询
成为签约讲师
经管文库
专家入驻
学术博客
就学平台
美国在职研究生
论坛BBS
服务一览
VIP服务
数据VIP
数据库
兑换商城
广告服务
案例库
软件销售
校园代理
文献下载
会员课服务
我的
帖子
收藏
好友
我的空间
关注的人
关注的贴
找人
文库
任务
道具
勋章
网站地图
搜索
搜索
用户
人大经济论坛
›
标签
›
职业病
标签: 职业病
经管大学堂:名校名师名课
相关帖子
版块
作者
回复/查看
最后发表
主成分分析法探讨职业病
数据分析与数据挖掘
wxq1638
2008-2-29
18
8239
txyw
2015-4-11 13:54:08
这十大职业病,你患了哪几种?
休闲灌水
小小小鱼3721
2015-2-9
7
1300
小小小鱼3721
2015-2-12 13:22:35
“中国式过马路”未必是行人惹的祸
教师之家与经管教育
sxghp
2014-9-24
2
1272
易启贷
2014-9-25 16:17:16
早晨一个吻长寿5年
休闲灌水
lugc2014
2014-9-8
7
1176
33884217
2014-9-8 15:00:44
人力资源管理者必备丛书 《人力资源管理劳动法律法规速查手册》
人力资源管理
lyk5060
2013-8-17
16
4223
toomuch
2014-5-6 07:44:57
为什么选择财务会计工作?大家需要注意哪些地方。
会计与财务管理
kewangwuxian
2013-9-8
15
14098
魅禾
2014-3-31 22:36:13
文章老婆马伊琍闲得骂网友 传将隐退出世
金融实务版
股市大亨
2014-3-7
2
869
rayzhangfy
2014-3-7 13:05:55
求《中华人民共和国职业病防治法》全文
- [!reward_solved!]
求助成功区
鲛人泣月
2014-2-12
1
440
牛尾巴
2014-2-12 15:07:29
怎样更好的维护工伤职工的合法权益
休闲灌水
88lynn
2013-11-4
0
725
88lynn
2013-11-4 13:56:42
教师要防职业病
休闲灌水
springsunyj
2012-9-17
1
680
千飒飒毛线
2012-9-18 14:37:51
[环境化学与人体健康].唐森本.扫描版.pdf
版权审核区(不对外开放)
xgz6151
2012-3-15
1
480
lone_king
2012-3-15 11:46:08
鼠标手颈椎病或进入职业病目录 专家称操作性不强
经管类求职与招聘
星博士
2012-1-11
0
900
星博士
2012-1-11 14:55:59
求指教
爱问频道
毛毛高
2011-11-19
1
904
毛毛高
2011-11-19 18:45:09
聚焦职业病防治法修正草案:单位不得阻挠诊断
经管类求职与招聘
星博士
2011-10-27
0
684
星博士
2011-10-27 13:32:13
好为人师的尴尬
哲学与心理学版
南岳耕夫
2011-9-11
10
2870
hnyzwfy
2011-9-13 18:08:18
2008至2010年铁岭市职业病发病概况调查报告
行业分析报告
easterking
2011-8-23
0
702
easterking
2011-8-23 14:11:20
职业病严重 年损3000亿
真实世界经济学(含财经时事)
bot2007
2010-2-3
0
1128
bot2007
2010-2-3 09:24:57
更多...
相关日志
分享
数学的精细
longwo
2012-9-18 10:16
除了客观因素之外,也许更主要的原因是我对写这些东西的意义又产生了疑惑。翻翻这个帖子,尤其是后来那些页,不断的越来越深的陷入到具体的推导细节中去。所以我便很疑惑写这些东西究竟有什么用。如果用直截了当的数学语言去陈述,我相信立刻缩短至少一半以上篇幅是轻而易举能做到的。如果说我写这些东西是给不熟悉精确简明的数学语言的大众朋友看,那么我又事无巨细的扯那些论证细节干嘛?总之,无论如何这件事不能自圆其说。那好,那我们换种方式,完全以“高兴的讲故事”为主,需要什么术语就不加提防的直接引用,彻底抛弃对逻辑严密性的幻想如何?但那样便会导致另外一面的问题,轻飘飘的高谈阔论谁都会,追究其细节却如破渔网般漏洞百出不能收拾,实非我所愿。数学是个极精细的东西,最糟糕的就是“看起来挺像”,“应该情况差不多吧”。尤其是已经沉淀了近一百年甚至更久的理论,其定理陈述每一个字的安排都是有讲究的。随便哪个不起眼的条件不满足,结论必然就错了,所谓失之毫厘,谬以千里。条件列在定理陈述中,必然在某一步要被用到,否则凭数学家眼里揉不得沙子的职业病,早就挥刀剔除了。 所以,我在开始写那个帖子时的初衷,是“在尽可能不伤害逻辑严密性情况下,用谁都看得懂的白话语言讲述概率理论”。后来事实证明,那几乎是个不切实际的幻想。毕竟,人家前后几年的概率课程不是白设置的,谁都不是傻子,如果有捷径又何必费那么多事。 刚才说到数学理论之精细,最怕稀里糊涂“看起来好像差不多”。我想顺手举一个例子,关于大数定律的。首先回顾一下,(强)大数定律说的是:“如果 X1,X2,X3..... 是 独立,同分布的随机变量列,每一个Xi的期望都是有限常数,那么当n趋于无穷时,前n个分量的平均(也就是 (X1+X2+...+Xn)/n ) 以概率为1的趋于 EX1 (那个固定的期望)”。一个简单实例,假如我们重复扔骰子,那么每一次结果的期望就是 3.5。扔一次我不敢说能多接近3.5,可能扔出1也可能扔出6,但如果扔的次数多了,把前面很多很多次(n次)的结果平均起来,我敢说这平均值随着n的增大是要渐渐趋于3.5的。这就是大数定律所要保证的事。现在,我们试图把定理需要的条件抽掉一点,看看会发生什么情况。“独立”这个条件很显然是不能抽的。极端的例子是我这一列随机变量完全一样,统统都是X,那么无论n是几,前n次结果的平均就是X刚刚取的值,那么这个值可能是1可能是2也可能是3,4,5,6,总之不会趋于3.5。这个显而易见,不值得多说。我想说的是把“同分布”这个条件抽掉如何? 为了试图使大数定律仍然成立,我们还是要保证每个 Xi 的期望(也就是Xi自己的平均值)都是一样的。只是说,X1,X2,X3.... 他们分别的分布不保证一样。事实证明,我们可以很容易的找到一列独立的,每一个的期望都相同的随机变量列,使得前n次结果的平均不趋于这个公共的期望。也就是说,大数定律被抽掉“同分布”条件之后不再成立了。 例子如下: 每一个Xn都只能取两个不同值----以 1/(n^2)可能性取值 n^2-1,以 1- 1/(n^2) 可能性取值 -1。这样,Xn的期望(或者说平均值)就是(动手算一下很容易): (n^2-1)* (1/(n^2)) + (-1)* (1 - 1/(n^2)) = 0 通俗的解释,你玩一个赌博游戏,第n次玩的情况是,你有很大可能性( 1-1/(n^2)的概率)会输一块钱,但同时你有很小可能性 ( 1/(n^2) 概率)会一笔赢个大的( n^2-1 块钱),总之,这些参数的选取保证你每一次玩的输赢平均值都是0元。那么这个游戏,你玩不玩?是不是很想当然的认为,既然每次结果的平均值都是0,那么我不停玩下去,总趋势也应该是不赔不赚才对吧。大数定律不是保证“重复很多很多次之后平均结果应该趋于那个每一次的平均值”吗? 如果你这样想,就错了。用概率理论可以证明,前n次结果的平均值,是以概率1的趋于 -1 的,也就是说,如果你玩很多很多次(n很大),那么你前n次结果的平均值大致是 -1,换句话说,你现在差不多已经输掉 n 块钱了。还继续玩?玩n次就大约输 n 块钱,你玩吧。 证明也很简单,就是 Borel-Cantelli 引理的简单应用。令 An 表示 {Xn 取值为 n^2-1} 这个事件,那么 An 发生的概率就是 1/(n^2),所以A1,A2,A3.....这一列相互独立的事件的概率全都加起来是收敛的(是个有限值)。那么由 Borel-Cantelli 引理, {An i.o.} 这个事件的概率为0。换句话说,以概率为1的可能性,只有有限多个Xn才能取到 n^2-1那个值,其它的 Xn 统统都是 -1. 那么当n越来越大趋于无穷的时候,前n个 Xn 的平均值当然只能是 -1 了。 检验完具体证明之后,我们发现,其实前面对于随机变量 Xn 的构造就是从这个 Borel-Cantelli 引理的想法来的。我们需要的就是,每个 Xn 取“大值”的可能性迅速衰减得极快,快到全部都加起来以后是收敛的(所以我们找到 1/ n^2 这个序列,这是个最常见的收敛级数)。然后再去寻找Xn能取的两个值,使得配上刚才预订好的概率之后,每个 Xn 的期望都恰好是 0。这也很容易,解个两三步的一元一次小方程就是了,小学生都会做。把这个例子这样拆碎破解之后,今后任何时候说起来,你都能稍加思索便马上构造出这个例子。具体的参数都是现算的,重要的是想法,非常简单。 通过这个例子我想说明,数学理论是极精细的东西。如果满不在乎其精确陈述,总是“看上去差不多吧,那多半也是对的”这种态度,那么没必要深谈。高谈阔论的感觉是挺良好,但在我看来几乎就是耽误时间,聊完了收拾走人该干嘛干嘛去,聊它干嘛?所以前面的帖子放在那里从4月底之后就没有更新,很大部分是出自这种心情。欲保持严密性,我没有这个能力;彻底放弃严密性,我又不愿。因此只好作罢。 今天想说的第二个例子,是用多项式去一致逼近闭区间上的连续函数,想通过它举例说明概率思想在其它数学分支中的应用。 我们考虑定义在闭区间 上的连续函数,我们希望找到一个多项式,使得这个多项式“几乎同刚才给定的连续函数差不多”。我们希望对于任意事先给定的正常数(很小) e,我们的多项式同给定的函数在任意一点的误差都不超过 e。这个性质叫做“一致”趋近,比“在每一点都趋近”要强。举个例子来说,如果你还记得初中代数课上学过的内容,那么考虑 x^n ,n=1,2,3....这串函数在开区间 (0,1) 上的图像。那么随着n越来越大,任何一个固定点 x 的n次方都是越来越趋于0的。可是无论n多大,函数 x^n 的图像的右端尾巴(靠近1的地方)都翘在上面,挂在那里。也就是说,虽然具体到每一个固定的 x, x的n次方都要趋于0,但是我们总体的看,总有那种“特别慢的x”在后面拖后腿,使得我们无论用多大的n值,图像的样子都不像那个 “0函数”,都不能令人满意。也就是说,x^n 这串函数在开区间 (0,1)上“逐点”趋于0,却不是“一致”趋于0。 问题的陈述是:对于定义在闭区间 上的任意连续函数,我们都可以找到足够高次的多项式,使得这个多项式同刚才给定的连续函数一致的逼近。 这个定理有个名字叫维尔斯特拉斯逼近定理,所找到的多项式叫做伯恩斯坦多项式。但是我不喜欢堆砌名词来吓唬人。本来是很简单直白的东西,却一会儿这个斯基一会儿那个莫夫吓唬人,很没意思。所以我总是先把东西说清楚之后再提一句它叫什么。 这个问题从陈述上看,完全是一个实分析的问题。但是令人意外的是,这个问题的解决有个很简单直接很漂亮的概率视角看法。具体证明我就不一步一步细说了,只给出这个多项式到底是什么。它是: E 其中 E 表示期望,f是事先给定的我们要去逼近的连续函数, Sn=X1+X2+....+Xn, X1,X2....是独立的标准伯努利随机变量,(以概率x取值为1,以概率 1-x 取值为0)。所以上面的表达式是一个关于 x 的函数,因为随机变量列 X1,X2.... 的定义依赖于 x。 有了这个具体的,实实在在的多项式在手之后,剩下的论证就只是一些标准计算了。其中会用到切比雪夫不等式,再看看根据 e 取一个多大的 n 才合适等等,总之都是按部就班了。精彩的内容是在前面,那个多项式是怎么给出来的?上面那个期望怎么就构造出了一个越来越逼近的多项式呢?奥妙究竟在哪里?这就需要自己去琢磨了。把式子展开写出来,仔细的想每一部分都是什么意思,究竟发生了什么。。。。这些我就不多说了。对于看不到这里的人来说,写了也没用;对于肯自己动脑子追根究底的人来说,本来就不需要我事无巨细。 再进一步说,近代概率理论同偏微分方程也有深刻联系。这其实并不意外。例如最简单的热方程的基本解,或者叫热核,写出来一目了然谁都看得出来它跟正态分布密度的联系,它刚好是布朗运动的转移密度。进而很多偏微分方程的解可以用概率语言表达。例如拉普拉斯方程的边值问题的唯一解可以表示为: E 其中 E 还是期望,f 是边值条件,W 是布朗运动,t_x (t 下标 x)是从x出发的布朗运动第一次到达边界的停时。 这很耐人寻味,偏微分方程是老老实实给定的方程,没有任何“随机”的不确定因素在里面,但为什么它的解却有概率表示呢?(其实也不那么奇怪, E 是取平均的意思,我都给你“平均”了,那么自然也就没什么“不确定”了) 再进一步概率里著名的 Feyman-Kac 公式,也是给出偏微分方程的解的概率表示,在金融学里有重要应用。这说明概率当然不是孤零零的学科。概率论同其它各个学科,包括同数学的各种其它分支都有深刻而精彩的联系。 今天想说的第三个例子,是关于网页的分级。希望通过这个例子来说明概率理论在现实问题中的强大应用。大家每天都在网上做搜索。输入一个关键词,哗啦一点出来上百万个相关链接,但是往往在搜索结果第一页上的前十个链接里面就能找到我们要找的东西。这是怎么做到的呢?究竟是通过什么办法能够从汪洋大海的搜索结果中筛选出“看起来像是重要的”那些网页呢? 事实上,单凭那个关键词的出现频率是很有误导性的。例如我自己造一个网页,这个网页上什么内容都没有,就把刚才那个关键词重复1万遍。那么试试搜得出来么?我没试过,但我猜多半是搜不到的。原因在于,判别一个网页重要与否的法则,不是由这个关键词出现的频率决定的,更重要的是看有多少其它网页链接到它,还有那些链接到它的网页本身“重要性”如何。 考虑一个简单模型,例如只有4个网页。我们能够记录到这4个网页之间互相的链接关系。那么我们记录到从一个网页A到另一个网页B有链接(换句话说有人先看了网页A,然后又继续点到了网页B),我们就在图上画一条从A指到B的箭头。这样把图完成后,我们会发现有的网页出去的箭头多,进来的箭头少;有的网页进来的箭头多,出去的箭头少。如果有那么个网页,在大家搜索某个关键词的时候,大多数搜到这个网页就停止了,不再继续连到别处,那么这个网页多半就是我们要寻找的“最重要”的。说到这里,大家应该很自然的立刻联想到,我们刚刚画的图可以很容易的变成一个 4X4 的矩阵,这个矩阵中的每一个元素都表示从某个网页连到另一个网页的“概率”,这样就同马尔可夫链的理论联系起来了。马尔可夫链在若干条件下向平稳状态的收敛,再配上些很浅的矩阵特征值理论(所有内容都不超出本科理论程度),这个问题能够得到很漂亮的解决。具体就不再细说了,有兴趣可以很容易的去搜到相关资料查看。 总结一下,今天谈了三个例子: 第一个例子:说明数学是个极精细的东西。定理陈述失之毫厘谬以千里。构造一个赌博游戏,每一把的输赢期望都是0,那么是不是连续玩下去总得来说也会不赔不赚?(大数定律貌似是这么说的)可事实上,概率理论证明它完全不是这回事,把游戏参数恰当构造之后,纵然每一次的平均值都是0,积累起来的总效果却可能趋到负无穷去。那么是不是大数定律错了呢?当然不是,原因在于你缺了大数定律所要求的一个条件没有满足。 第二个例子:说明概率理论同数学其它分支有着千丝万缕的深刻联系。 第三个例子:说明概率理论在生活中的具体问题中的强大应用。 概率理论是非常强大的。当然,数学的其它分支也同样强大,我相信其它各个严肃学科的理论,虽然我是外行不怎么懂,也一定是同样强大的。有兴趣不妨尽力去多了解些,毕竟人活一世,应该与草木不同。人类千百年智慧积淀创造的宝库就在身边,可是绝大多数人终其一生都不屑一顾,整日就知道虚耗时间,辩论狗屎一样没有价值的问题(例如谁“最”厉害,今人不够比古人,围棋不够比数学物理,动辄高谈谁“最”伟大,问题是你懂多少呢?真有能力去断那些大师的高低么?),吾未见其明也。
20 次阅读
|
0
个评论
更多...
京ICP备16021002-2号
京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明
GMT+8, 2024-5-13 23:58
积分 0, 距离下一级还需 积分