楼主: zhoujin6108
6899 38

请教一组数据的概率和頻率问题! [推广有奖]

11
sungmoo 发表于 2009-7-30 12:22:19
猫爪 发表于 2009-7-30 12:18 我估计这位楼主的意思,是要用已有的数据的“频率”,估计出“概率”,然后推测未来的实验结果。
“频率”也不是凭空出来的概念,需要先指明其中的“频率”是如何定义的——而这必须先指明“试验”。

12
zhoujin6108 发表于 2009-7-30 14:11:06
猫爪 发表于 2009-7-30 12:18
sungmoo 发表于 2009-7-30 12:10
如果不介绍“试验”,我只给你一串数1,2,3,4,5,让你猜下一个数是几,你觉得要怎么猜呢?
我估计这位楼主的意思,是要用已有的数据的“频率”,估计出“概率”,然后推测未来的实验结果。
    你说的没错..........

13
猫爪 发表于 2009-7-30 16:37:00
zhoujin6108 发表于 2009-7-30 14:11
猫爪 发表于 2009-7-30 12:18
sungmoo 发表于 2009-7-30 12:10
如果不介绍“试验”,我只给你一串数1,2,3,4,5,让你猜下一个数是几,你觉得要怎么猜呢?
我估计这位楼主的意思,是要用已有的数据的“频率”,估计出“概率”,然后推测未来的实验结果。
    你说的没错..........
呵呵,要是这样,本帖可以转爱问版了。

请注意频率的定义:

在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数na称为事件A发生的频数。

比值na/n称为事件A发生的频率,并记为fn(A)。

用文字表示定义为:每个对象出现的次数与总次数的比值是频率。

既然提到了“推测”,这就说明,你给出的这组数据,仅仅是一个样本,而非整个空间。

请记住,猫科动物只有四个指头,所以没有中指~~~~~

14
tekuaile 发表于 2009-7-30 18:28:59
猫爪 发表于 2009-7-30 16:37
zhoujin6108 发表于 2009-7-30 14:11
猫爪 发表于 2009-7-30 12:18
sungmoo 发表于 2009-7-30 12:10
如果不介绍“试验”,我只给你一串数1,2,3,4,5,让你猜下一个数是几,你觉得要怎么猜呢?
我估计这位楼主的意思,是要用已有的数据的“频率”,估计出“概率”,然后推测未来的实验结果。
    你说的没错..........
呵呵,要是这样,本帖可以转爱问版了。

请注意频率的定义:

在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数na称为事件A发生的频数。

比值na/n称为事件A发生的频率,并记为fn(A)。

用文字表示定义为:每个对象出现的次数与总次数的比值是频率。

既然提到了“推测”,这就说明,你给出的这组数据,仅仅是一个样本,而非整个空间。
从概率论角度看,概率是频率的极限(概率的统计定义)。从统计学的角度看:

频率是基于一组实际观测数据的相对次数,一如以上定义。其特点是随各次试验和试验次数n的不同而改变,是随机变量的一个观测或随机样本的一次实现。具体试验之前肯定不能确定其确切值,但试验后只有唯一值。

概率是基于随机变量概率分布的理论相对次数。如果知道了该变量的概率分布类型及其参数就肯定知道了它取各种值的概率,变量值和概率一一对应或唯一确定。问题的困难在于我们不知一个实际问题(变量)理论上究竟应该服从什么分布。

简单而言,概率是随机变量所有可能值的相对次数,可称为总体分布或理论分布,由于(可重复试验无限)总体所有可能值不可观察,概率就不能用求相对频数的方法计算。可以(1)依据数学法则用概率分布模型计算,(2)获得一组实际数据的相对次数(频率),它们是一个样本的分布或经验分布,用来推断未知总体分布。

15
zhoujin6108 发表于 2009-7-30 21:53:38
你们说的都很好,现在就是怎么来解决我所提出的问题!不管用啥方法.....................

16
zhoujin6108 发表于 2009-7-30 22:07:44
蒙特卡罗模拟  当科学家们使用计算机来试图预测复杂的趋势和事件时, 他们通常应用一类需要长串的随机数的复杂计算。设计这种用来预测复杂趋势和事件的数字模型越来越依赖于一种称为蒙特卡罗模似的统计手段, 而这种模拟进一步又要取决于可靠的无穷尽的随机数目来源。
  蒙特卡罗模拟因摩洛哥著名的赌场而得名。它能够帮助人们从数学上表述物理、化学、工程、经济学以及环境动力学中一些非常复杂的相互作用。数学家们称这种表述为“模式”, 而当一种模式足够精确时, 他能产生与实际操作中对同一条件相同的反应。但蒙特卡罗模拟有一个危险的缺陷: 如果必须输入一个模式中的随机数并不像设想的那样是随机数, 而却构成一些微妙的非随机模式, 那么整个的模拟(及其预测结果)都可能是错的。
  最近, 由美国佐治亚大学的费伦博格博士作出的一分报告证明了最普遍用以产生随机数串的计算机程序中有5个在用于一个简单的模拟磁性晶体中原子行为的数学模型时出现错误。科学家们发现, 出现这些错误的根源在于这5个程序产生的数串其实并不随机, 它们实际上隐藏了一些相互关系和样式, 这一点只是在这种微小的非随机性歪曲了晶体模型的已知特性时才表露出来。贝尔实验室的里德博士告诫人们记住伟大的诺伊曼的忠告:“任何人如果相信计算机能够产生出真正的随机的数序组都是疯子。”
      以上有谁研究和学习的,或许能能帮上忙....

17
zhoujin6108 发表于 2009-7-30 22:22:47
蒙特卡罗(Monte Carlo)方法,或称计算机随机模拟方法,是一种基于“随机数”的计算方法。这一方法源于美国在第一次世界大战进研制原子弹的“曼哈顿计划”。该计划的主持人之一、数学家冯·诺伊曼用驰名世界的赌城—摩纳哥的Monte Carlo—来命名这种方法,为它蒙上了一层神秘色彩。
  Monte Carlo方法的基本思想很早以前就被人们所发现和利用。早在17世纪,人们就知道用事件发生的“频率”来决定事件的“概率”。19世纪人们用投针试验的方法来决定圆周率π。本世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。

  考虑平面上的一个边长为1的正方形及其内部的一个形状不规则的“图形”,如何求出这个“图形”的面积呢?Monte Carlo方法是这样一种“随机化”的方法:向该正方形“随机地”投掷N个点落于“图形”内,则该“图形”的面积近似为M/N。

  可用民意测验来作一个不严格的比喻。民意测验的人不是征询每一个登记选民的意见,而是通过对选民进行小规模的抽样调查来确定可能的优胜者。其基本思想是一样的。

  科技计算中的问题比这要复杂得多。比如金融衍生产品(期权、期货、掉期等)的定价及交易风险估算,问题的维数(即变量的个数)可能高达数百甚至数千。对这类问题,难度随维数的增加呈指数增长,这就是所谓的“维数的灾难”(Course Dimensionality),传统的数值方法难以对付(即使使用速度最快的计算机)。Monte Carlo方法能很好地用来对付维数的灾难,因为该方法的计算复杂性不再依赖于维数。以前那些本来是无法计算的问题现在也能够计算量。为提高方法的效率,科学家们提出了许多所谓的“方差缩减”技巧。

  另一类形式与Monte Carlo方法相似,但理论基础不同的方法—“拟蒙特卡罗方法”(Quasi-Monte Carlo方法)—近年来也获得迅速发展。我国数学家华罗庚、王元提出的“华—王”方法即是其中的一例。这种方法的基本思想是“用确定性的超均匀分布序列(数学上称为Low Discrepancy Sequences)代替Monte Carlo方法中的随机数序列。对某些问题该方法的实际速度一般可比Monte Carlo方法提出高数百倍,并可计算精确度。

18
sungmoo 发表于 2009-7-31 07:42:04
tekuaile 发表于 2009-7-30 18:28 从概率论角度看,概率是频率的极限(概率的统计定义)
不能这样简单理解。

频率应该是“依概率(测度)收敛于”概率。

(参见贝努利定理)

19
sungmoo 发表于 2009-7-31 07:45:51
zhoujin6108 发表于 2009-7-30 21:53 你们说的都很好,现在就是怎么来解决我所提出的问题!不管用啥方法
简单说,你的这套数据,反映的信息还很不充分。

可以有太多可能的答案。

正如“我给你1,2,3,4,5,让你猜下一个数是几”一样。

20
zhoujin6108 发表于 2009-7-31 08:24:18
上述的数据是可以无限的延伸下去,如果你认为样本规模不够,还可以提供啊!我需要知道处理这类问题何种方法最有效.......................谢谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-25 16:32