楼主: zhoujin6108
6902 38

请教一组数据的概率和頻率问题! [推广有奖]

21
zhoujin6108 发表于 2009-7-31 08:26:42
贝努利试验  如果一个试验中只关心某个事件A是否发生,那么称这个试验为贝努利试验,相应的数学模型称为贝努利模型.
  对随机实验中某事件是否发生,试验的可能结果只有两个,这种只有两个可能结果的实验称为贝努利试验。
  重复进行n次独立的贝努利试验,这里“重复”的意思是指各次试验的条件是相同的,它意味着各次试验中事件发生的概率保持不变,“独立”的意思是指是指各次试验的结果是相互独立的,这种试验所对应的数学模型成为贝努利概型。有时为了突出实验次数n,也称为n重贝努利试验。
  在n重贝努利试验中,事件A发生的次数ξ是一个随机变量,它可以取0、1、2……n共n+1个可能值。关于贝努利试验,有如下的重要定理。
  对于贝努利概型,事件A在n次试验中发生k次的概率为 Pn(k)=Cnkpkqn-k (0≤k≤n) (公式1)
  事件A至多出现m次的概率是 m P{0≤ξ≤m} = ∑Cnkpkqn-k (公式2) 
  K=0 事件A出现次数不小于l不大于m的概率是 m P{l≤ξ≤m}= ∑ Cnkpkqn-k (公式3) 
  K=l 贝努利分布的期望 E(ξ)=np (公式4) 
  给定出现A的几率为p,用上面的公式就可以计算出试验次数为n时的几率。
  当n为偶数时,计算公式为 n P{n/2+1≤ξ≤n}= ∑ Cnkpkqn-k (公式5) 
  K=n/2 当n为奇数时,计算公式为 n P{n/2+1≤ξ≤n}= ∑ Cnkpkqn-k (公式6) 
  K=n/2+1 其中K=n/2+1取整数。

22
sungmoo 发表于 2009-7-31 08:32:52
前面说的就是,你最好把生成数据的过程(试验)描述一下。

23
sungmoo 发表于 2009-7-31 08:33:32
至少说出,每一次试验的可能结果有哪些。

24
zhoujin6108 发表于 2009-7-31 08:47:18
古人云:凡事预则立,不预则废,强调无论做什么事都要预先谋划,事前设计,这离不开对事物和现象的规律的认识。对确定性现象,只有清楚其中的因果关系才能准确地预测结果。而对随机现象,却只要知道了概率就能进行预测,但应该注意的是,概率要预测的不是随机事件的结果,而是大量随机事件的结果在数量上的规律性。例如,扔一次硬币,你无法说出是正面还是反面朝上,对此你毫无把握,只能说:“出正面的机会有二分之一”,如果这时还有人说:“出正面的机会有三分之一”,不管这次出的是哪一面,这两个结论都不能体现出来;但如果扔的是一百次或更多的次数,如一万次,那么“有三分之一机会出正面”的说法就明显站不住脚,而“有二分之一机会出正面”的说法却可以得到相当程度的体现。下面我们详细地阐述用概率进行预测的原理。一 大数定律  在同样的条件下进行大量试验时,根据频率的稳定性,事件A的频率必然稳定在某一个确定的常数p附近,则定义事件A的概率为:         P(A)=p  这称为事件概率的统计定义,相应得到的概率称为统计概率,概率的统计定义给出了计算事件概率的近似方法,即当试验次数充分大时,可用事件的频率作为该事件概率的近似值。然而不能理解为,试验的次数越多,事件的频率就越接近事件的概率。例如,对于扔硬币这样的试验,一个人扔了两次,正好一次正面一次反面,出现正面的频率为0.5,正好等于出现正面的概率;而另一个人做同样的实验,扔了10000次,出了4985次正面,出现正面的频率为0.4985,反而不等于出现正面的概率,这扔10000次还不如扔两次的结果精度高,那这多出的9998次是不是就白扔了呢?要解释这个现象,必须更详细地研究频率和概率之间的关系。
  实际上,频率是一个随机变量,有多种以至无数种可能的取值,可以是0-1之间的任何一个数字。而概率是一固定的常数,是0-1之间的一个确定数字。我们对以概率为中心的某一区域感兴趣,频率可能落在这个区域内,也可能落在这个区域之外;对于确定的试验次数n,频率落在区域内这个事件也有一个概率,当试验次数n增大时,这个概率也增大;当试验次数无限增加时,这个区域将变得无限小,频率落在区域内的概率将等于1。
  一般地,频率和概率之间的关系不是以普通的等式来表达,而是以事件的频率和概率之差落在某个范围之内的概率来表示,即:           P( | μn/n─p|<ε)  指定ε的大小,运用概率论中有关切比雪夫不等式的知识就可以计算出这个概率的大小。
  当试验次数n无限增加时的结论,就是大数定律。大数定律是概率论中一系列定律的总称,又称“大数法则”或“平均法则”,是概率论主要定律之一。
  历史上,贝努里第一个提出大数法则。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
  除了文字表述形式,大数定律还有精确的数学表示形式。
  在贝努利试验中,当试验次数n无限增加时,事件A的频率μn/n(μn是n次试验中事件A发生的次数),依概率收敛于它的概率p。即对任意ε> 0,都有:        lim P( | μn/n─p | <ε) = 1        n→∞  这就是贝努利大数定律。当然,上面这个公式看起来有些费劲,这没有关系,因为人人都懂它的文字表述,大数定律的文字表述有更现实的指导意义。概率的统计定义“频率稳定于概率”的意思是很不明确的,贝努利大数定理从数学上讲清楚了这个问题,“频率稳定于概率”的含义是:事件A的频率μn/n依概率收敛于它的概率p,也即当n充分大时可以以任何接近于1的概率断言,μn/n将落在以p为中心的ε区域。
  大数定律以明确的数学形式表达了随机试验的规律,并论证了它成立的条件,从理论上阐述了这种大量的、在一定条件下的、重复的随机现象呈现的“频率稳定于概率”的规律性。由于大数定律的作用,大量随机因素的整体作用必然导致某种不依赖于个别随机事件的结果。
  如果说概率论是有关随机现象预测理论的话,那么大数定律就告诉了我们预测的方法,该如何进行预测。贝努利大数定律从理论上证明了通过试验来确定概率的方法:做n次独立的重复试验,以μn表示n试验中A发生的次数,当n足够大时,那么我们可以以很大的概率确信:p≈μn/n。在事件的概率未知或者需要验证理论计算出的概率是否准确时,我们常用这种方法。
  反过来,已知事件的概率,当n足够大时,就可以用事件的概率来预测n重贝努利试验中事件发生的次数: μn≈p×n ,其中n越大,预测的可信度就越高。
  现在就可以来解释前面提到的现象。扔两次硬币,还有可能出现两次都是正面或两次都是反面的情况,把这时的频率当作概率显然是错误的,就是说把扔两次硬币的频率当作是概率,发生严重偏差的概率高达50%,而把扔10000次硬币的频率当作概率在绝大多数情况下结果都是相当可信的。结论是,试验10000次比试验两次得到的结果更可信,并不违反直觉所告诉我们的。
  因此,用统计方法来确定事件的概率时,频率随试验次数的增加接近概率也是以概率的方式。统计的次数越多,频率接近概率的可能性就越大,其结果就越可信,可以认为,统计次数反映了结果的可信程度,而此时的频率结果与概率有多接近则有一定的随机性。换言之,通过试验来确定概率是有风险的,在任何情况下,都有频率偏离概率的情形存在,增加试验的次数,可以降低这种风险,却不能消除风险本身,只有在试验次数为无穷大的情况下,才不存在这种风险。不过,当试验的次数是足够多时,尽管把频率当成是概率还是有出错的可能,但这种可能性已经非常小了,以至可以完全放心而无须担心出错.

25
一个id 发表于 2009-7-31 10:39:38
楼主是否想通过学习概率知识发财啊,呵呵。

那你最好把整个“实验”的过程和结果都描述一遍,而不是不停地把搜索来的知识罗列。

26
sungmoo 发表于 2009-7-31 11:31:51
如果我看到楼主给的这些后验结果,我的猜想(只能是猜想)是,每次试验有2^8=256种可能结果。

27
zhoujin6108 发表于 2009-7-31 12:22:08
概率和頻率问题!

你说的没错!它是个系统性问题,对于很多领域都会有用的!

28
zhoujin6108 发表于 2009-8-2 08:31:23
难道会没有人能处理这类问题吗?

29
sungmoo 发表于 2009-8-2 08:32:16
zhoujin6108 发表于 2009-8-2 08:31 难道会没有人能处理这类问题吗?
到现在你还看不清楚别人问的问题吗?

你给的信息远远不够。

30
sungmoo 发表于 2009-8-2 08:32:55
你的这个题目,与前面给你的“1,2,3,4,5”猜“下一个数”,没有多大区别。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-25 20:51