谢谢各位回帖!
节假日有点空闲,再补充一些看法,权作对大家回帖的答复。
凡是严格遵守形式逻辑的科学,一定是“线性科学”,是离散结构。它对真实世界的连续结构只能是一种“逼近和近似”,在标度、维度、精度、速度、温度……在一定范围变化时,它的“误差”一定会显现。从哲学角度看,真实世界是辨证的,是连续结构,形式逻辑是人造的,是离散结构,离散结构(线性科学)与连续结构(真实世界)之间的矛盾,本质上就是形式逻辑与辩证逻辑之间的矛盾。用线性科学去逼近和近似的分析真实世界,矛盾是一定会显现的!
还是用上面的例子,来具体看看概率理论的局限性:
一、 维度变化:我们给这些小球增加一个正交的特征,就是增加了维度,上面的分析已经告诉我们,概率理论在维度增加时,就会得出自相矛盾的结论。
二、 精度变化:我们给3色的9个小球标上1-9的数字,就是提高了识别的精度。随机摸3球,计算3球都为红色的概率。在精度没有提高时,小球只有颜色作为标识,这个概率为 1/27=3.7%。提高精度后(用数字做标识),基本事件变成了504个,这个概率变成1/84=1.19%了!按理我们不改变小球的颜色、仅仅给小球加上数字标识,是不应该改变摸到3球都为红色的概率的,但是概率理论却明明白白的算出来,两者的概率是不同的,而且差异很大(差了3倍!)!这显然与真实世界的真实情况是相悖的。
三、 标度的变化:我们扩大3色球的标度——再增加9个同样3色的小球,这次用1-18的数字标定这18个3色小球,基本事件就变成了4896个,3球都为红色的概率变成5/204=2.45%。如果再增加9个同样3色的小球,用1-27的数字标定这27个小球,基本事件变成了 17550个,3球同为红色的概率变成了28/975=2.87%。《概率理论》在这里用这些数字明确告诉我们,即使3种颜色的小球同比例增加,随机摸3球都为红色的概率是会变化的。可是我们如果不给这些小球标上数字的话,《概率理论》却会告诉我们,不管可供取样的小球增加多少,只要3种颜色的小球同比例增加,随机摸3球都为红色的概率是不变的!——难道在颜色球上标不标数字会影响摸颜色球时发生的概率?显然不会!
所以我说,线性理论在维度、精度、标度变化时,它的误差会显现——《概率理论》是线性的,一定有它的局限性。
在实际运用概率理论时,人们的线性理解,也会产生错误。譬如《生日悖论》,就是一个延续了几百年的谬误!而且至今还在继续误导全世界的下一代!
《生日悖论》是个有名的《概率理论》的结论。
……略,可参考原帖的相关内容……
我们还可以这样来考察《生日悖论》的结论:假定我们对这个熵最大的系统随机取样24人,他们平均分布在12个月的概率应该是最大,也就是平均一个月分布两个人的概率应该是最大的。两人生日相同的前提是在同一个月里出生,不在同一个月出生的人也可以互相比对生日,但是这个比对的结果是确定的概率为0事件(不可能发生的事件),不能列入基本事件。所以23个人虽然有253次比对生日的机会,实际上其中绝大多数是概率为0 的事件,正是由于大量的非基本事件参与了计算,才会得出那么离谱的结论。
其实这里的关键,就是一个“序”的问题!大家在理解《生日问题》的时候,都把《生日问题》看成是一个没有“序”的问题,因为我们只关心是否有人生日相同,对哪一天发生生日相同事件、这些生日相同事件是如何排列的、或同一天生日的有几个人……等问题,都不关心。所以《生日问题》一直被认为是没有“序”的问题。事实上,《生日问题》有一个严格的“序”的问题!一年的365个生日,就像365个席位,本身是严格排序的,它们之间没有“两两相同”的可能(或者说不存在比对的需要)。我们一旦取样N个人,这N个人每个人占据的席位就是确定的,不会再变动,不是同一个席位的人之间,根本就不存在互相比对生日相同的必要(或者说比对生日是否相同的概率是确定的0)。用这样的思路来分析这个问题,我们就很清楚了,在这里根据《概率理论》做N个人的排列组合后再计算,是错误的!实际上被取样的N个人,并不是围成一群在互相比对生日,而是直奔自己的席位坐下,不同席位的人,根本不存在比对生日的必要(这种比对是确定的概率为0 事件)。实际情况是:取样N个人,只要这N个人中有人坐到了相同的席位上,就发生了生日相同事件,同时,也一定有“空席位”产生,也就是N个人占据了少于N个席位,所以《生日问题》实际上要研究的,就是这N个人坐到自己的席位上以后,占据的席位数与N是否相同,如果N个人占据的席位数小于N个,就一定发生了生日相同的事件。因此,计算取样N个人发生生日相同事件的概率,就是计算N个人应该占据的N个席位中,发生“空席位”的概率是多少。根据这个思路,我做出以下推论:
一、 N个人最多占据N个席位(生日全部不同);
二、 N个人至少占据一个席位(生日全部相同);也就是取样N个人,N个席位中,1个座位不为空是绝对的,是概率为1 的事件。
三、 N个人各取哪一天生日,是完全独立的等价事件,互相没有影响。
四、 N个人应该占据的N个位子,都有发生空席位的可能性,这些席位发生空的可能性,也完全是等价的独立事件,互相没有影响。
五、 所以,取样N个人,发生空席位的可能性为N个,但是根据第二条推论,必须减去1个绝对不为空的席位(我们不关心是哪一个)。因此取样N个人,发生空席位的可能性为:(N-1)个;
六、 由于每个人只能有一个生日,只能占据365个席位中的一个,也就是占据所有席位的1/365。而取样N个人,如果没有生日相同事件发生,N个人一定占据所有席位的N/365;如果有生日相同事件发生,就是有空席位事件发生,N个人发生空席位的可能为(N-1)个,所以取样N个人时,发生(N-1)个空席位的可能占总席位数的(N-1)/365,这就是取样N个人发生生日相同的概率:
P=(N-1)/365
当 N=1时,P=0,没有生日相同的可能发生;
当 N=366时,P=1,发生生日相同的概率为1。
这是个完全线性的公式,适用于任何标度。
我们可以用这个公式和《生日悖论》的公式做些比较:
这个线性的公式告诉我们:
当N= 60 时,发生生日相同事件的概率为16.16%;
当N=100时,发生生生日相同事件的概率为27.1%;
当N=200时,发生生日相同事件的概率为54.52%;
这些结论告诉我们,不要说随机抽取100个人,这些人完全可能均匀的散布在365个席位上,不发生生日相同事件;即使随机抽365个人去坐这365个席位,也有可能正好365个人的生日都不同!
但是《生日悖论》却告诉我们:
当N=60 时,发生生日相同事件的概率为99%;
当N=100时,发生生日相同事件的概率为99.99996%;
当N=200时,发生生日相同事件的概率为0后面29个9!
(因字数超过回帖规定,分两部分写,见谅!)