楼主: 时光永痕
740 0

[数据挖掘新闻] 广义随机演算 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

9%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2020-10-22 09:35:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
广义随机演算
1963年,Benoit Mandelbrot发表了一篇名为“某些投机价格的变动”的文章。这是对形成理论的回应,该理论将成为现代投资组合理论。过于简单化的话,曼德尔布罗特的论点可以概括为“如果这是你的理论,那么这不可能是你的数据,这就是你的数据。” 这个问题困扰着Black-Scholes,CAPM,APT和Fama-French等模型。它们都没有通过验证测试。确实,可以提出一个很好的论据,即法玛(Fama)和麦克贝斯(MacBeth)在1973年进行的测试本应结束此类讨论,但事实并非如此。我要争论的是,这些模型中的每一个都有一个数学问题,我相信以前没有注意到。我发现该问题的解决方案是针对此类问题构造新的随机演算。
本文的结构是首先探索估计值的属性,这些估计值对于在自己领域内工作的经济学家甚至数据科学家而言可能并不明显。第二部分是研究为什么CAPM之类的模型缺少贝叶斯模型。第三是调查信息问题及其在创建新演算中的作用。
每个均值方差模型以及APT和Fama-French模型都建立在频繁公理的基础上。本文不是对频繁性的攻击,而只是对它的观察。我之所以这样说,是因为在概率和统计量中,公理的选择也将根据数据确定解的确定值。在某种程度上,似乎是这种情况。在从任何技术角度讲数学之前,我将提供两个示例。其中之一是贝叶斯与频率,而另一个是频率,但假设损失函数不同。目的是说明结果对使用的公理和假设的敏感性。
对于第一个插图,考虑一个标有数字的轮子;轮盘就可以。可以将其视为带信息轮盘的逆向游戏。赌徒看不到球落在哪里,他们只有在副主持人观察到数字后才放下赌注。
该示例在决策理论中相对常见。在球着陆并选择了一个数字后,将掷出两个公平的硬币。如果硬币朝上,则主持人将向赌徒显示落球位置左侧一个单位的价值。如果正面出现,则主持人将在球着陆点的右边显示一个单位的价值。这将创建一个具有三个可能结果{L,L},{R,R}和{L,R}的样本空间。我们关注的是在选择赌博数字时采取的最佳行动。
让我们假设数字增加了17。主持人发出的信号将是{16
在{16
此图显示了两个关键事实。首先是公理系统的选择可以确定行动的过程,而与其他系统的决策功能不一致。第二个是荷兰书定理的例证。
荷兰图书定理类似于无套利假设,但其基本假设较弱。但是,它有一个意外的结果。您始终可以使用贝叶斯方法进行赌博,而不能使用Frequentist方法进行赌博。诸如Black-Scholes和资本资产定价模型之类的模型是有关如何在特定类型和一组彩票中进行赌博的说明。它们建立在频繁公理上。现在想象一下,一位经济学家正在测试上面的游戏,在该游戏中,没有人会按照MVUE的行为行事。经济学家可能会拒绝该模型,也可能会争论人们的行为不合理,但这实际上是因为所使用的公理,而不是行为。任何大规模的行为测试都将是“错误的”。
使用惯常规则的做市商或博彩公司也将遭受损失,而不仅仅是经济学家。长期的最佳行为将赋予1:1的几率。使用Ito模型的做市商应该不时让人们吃午餐。难怪对冲基金比比皆是。危险的是,如果以伊藤方法为基础,那么11万亿美元的未偿付的场外期权溢价被错误定价。根据定理,即使每个假设都成立,基于Ito方法论构建的任何事物都将被系统错误定价。
第二个例子起源于韦尔奇(Welch)在1939年发表的一篇论文,并在莫雷(Morey)等人的文章“在置信区间中置信的谬论”中得到了扩展。他们的论文是关于人们在使用置信区间时犯下的,严重的和普遍的智力错误。他们还描述了贝叶斯可信区间,尽管贝叶斯案例在这里不是必需的。
在故事中,一艘潜水艇沉入海底,救援人员展开努力以拯救船员。不幸的是,时间不多了,成功进行救援的机会只有一次。幸运的是,现在有一个统计学家,该统计学家可以构造一个关于救援口位于何处的置信区间。不幸的是,存在无限数量的可能置信区间可供选择。它们不匹配的事实引起了关于选择哪种程序的疑问。Morey等。描述三个过程加一个贝叶斯过程。
他们对问题的描述是:
长达10米的研究潜水艇已潜入水中,并与船上的几个人失去了联系。潜水艇正好在其长度的一半处有一个救援口,支撑船将在该救援口处下降。由于救援人员仅能进行一次救援尝试,因此至关重要的是,当管线在深水中掉入船只时,管线应尽可能靠近该舱口。支持船上的研究人员不知道潜水器在哪里,但他们确实知道它会形成两个独特的气泡。这些气泡可能以相等的概率独立地沿着飞船的长度形成在任何地方,并漂浮到支撑船可以看见的表面。
需要注意的一件事是,如果气泡之间的距离恰好为10米,则可以完全确定救援舱口的位置,而如果气泡之间没有距离,则舱口必须在正负五米之内。在此示例中,忽略了使用xy平面而不只是x轴的可能性。
这里有几个事实是相关的。首先是置信区间的定义是在无限重复时,它至少在一定时间百分比内覆盖了参数。第二个是至少经常覆盖参数的任何函数都是有效的置信度过程。第三是该程序需要良好的长期功能,并且没有考虑可能性,因此不以当前的具体情况为条件。第四,可能性的大小为10-d,其中d是气泡之间的距离。最后,由于样本大小只会是两个(n = 2),并且希望有一个狭窄的区间,因此统计学家选择的是百分之五十的区间,而不是更传统的百分之九十五的区间。
统计人员考虑的第一个程序是在气泡的平均位置加上或减去大约1.46。因为潜水艇的宽度是固定的,并且均值的采样分布是三角形分布,所以将5减5再除以2的平方根就可以保证至少在50%的时间出现覆盖率。
第二个过程是非参数的。请注意,有25%的观测值必须在中位数的d / 2之内,采用中位数d / 2或减去d / 2也是50%的置信度。这也与n = 2的Student t分布下的解一致。因此,这也是向本科生教授的最常见的程序。
第三个置信度过程是采取统一最有效的检验的逆过程。如果d <5,则使用均值正负d / 2的非参数方法,否则使用均值正负5负d / 2。
这些过程中的每一个都占百分之五十的时间,但是这些过程中的任何一个是否合适?
如果气泡相距九米,则舱口可能只有一米的范围,这也是似然函数。第一个过程的宽度为2.92米,第二个过程的宽度为9米,第三个过程的宽度为1米。尽管前两者的宽度超出了必要的范围,并且全部取决于所需的精度,这三者都可以百分百地覆盖可能性,但这可能会导致不必要的故障。
另一方面,如果气泡相距一米,则第一个过程的覆盖范围仍为2.92米宽,第二个和第三个过程的覆盖范围为一米宽。可能性是九米宽。从贝叶斯角度看,第一个过程大概有32%的机会遮盖舱口,而后两个过程大概有11%的机会遮盖舱口。当最后两个过程在真实位置上的信息量最少时,它们看起来最准确。
但是,这并不是说应该使用贝叶斯过程。这个教训是,置信区间是最小化某些损失函数的结果。这些过程中的每一个都使不同类型的损失最小化。置信度程序不能衡量结果的准确性,也不能给出结果在范围内的概率。它们提供了一个频率,随着重复次数的增加,参数将被覆盖。
损失函数对于这种新提出的演算至关重要。损失也是主观的。从潜水员的船员的角度来看,这是一个全有或全无的损失函数,重复时的属性对他们而言并不重要。从他们的角度来看,他们不在乎是否挽救了一百名船员中的至少五十名,他们只在乎是否一次救了他们。另一方面,进行救援的公司的财务结果可能会产生不同的考虑因素,而不仅仅是生命和肢体的直接风险。他们确实在乎所使用程序的长期属性以及生命损失,任何特定的赔偿计划(例如保险)和因估算失败而造成的损失结构。
任何规定的程序都不可能满足公司的需求。因为从长远来看仅适用于获救的船员,并且他们的配偶允许他们再次出海,所以“常客”程序可能无法满足船员的需求。在建立财务模型时,主观损失结构通常被掩盖。当统计学家或经济学家做出错误估计时,提议的演算将迫使对结果进行审查。
未能考虑诸如Black-Scholes之类的模型在赌博中的目的,以及未能考虑适当的损失函数,使得这些金融模型的效用和适当评估令人怀疑。其中很大一部分可能是这些模型变得比作者预期的要重要。从某种意义上说,经济学过于重视它们,特别是因为它们缺乏验证。
本文的第二个总体目的是研究为什么这些模型没有贝叶斯对应物。尽管研究人员不时使用贝叶斯方法来测试这些模型,但使用频繁模型却存在问题。与上面的轮盘赌示例一样,当以不同的范式构造时,两个模型会做出两个不同的预测。用贝叶斯方法检查频率模型可能是检查错误的预测。毕竟,贝叶斯检查表明赌注应该提供1:1的赔率与贝叶斯主义者一样容易失败,但是正确的贝叶斯预测并不是1:1的赔率。贝叶斯方法需要对模型进行完全重建。那就是微积分问题开始发生的地方。
Ito方法是Frequentist方法,并假定参数是确定的。它遵循零假设的思想。当一个人断言一个零假设时,一个人就可以断定地断定参数的真实值。建模和测试之间的区别在于,建立实验的目的是拒绝无效值。对于要保持的建模,关于参数的完整信息的假设非常重要。
当在贝叶斯思想中意识到参数是随机数时,重要性就显现出来了,因此必须断言一个人不知道这些参数。知道参数的真实价值很重要。那是关于世界的很多信息。如果放弃该假设,则计算还必须考虑参数的不确定性,而不仅仅是机会变量的不确定性。那是另一类问题。资本市场线因存在的不确定性而从存在中消失。
了解为什么可以考虑CAPM中财富的当前价值和财富的未来价值之间的时间跨度关系。其等式是,未来价值等于现值乘以投资回报加上对评估后的未来价值的随机冲击。通常认为它是正常冲击,但只要冲击的位置中心为零且方差有限,则无关紧要。没关系的原因是,在频率论统计中,人们知道该方程式中的奖励价值没有可以收敛到总体参数的估计量,该参数也与均值方差金融一致。如果不确定确定CAPM参数,则无法使用与理论相符的估计器来估计它们。中位数或分位数回归将产生一个估计量,
另一方面,贝叶斯模型存在另一个问题。对于经济学家来说,使用惯常模型将收益视为数据是很常见的。实际上,它们作为数据进行了研究。但是,在贝叶斯范式中,它们是价格和数量的函数。实际上,在频率论范式中,它们也是一样,但是模型将它们视为原始构造。
因此,如果收益是价格比率乘以交易量比率减去一的乘积,那么收益就是统计数据。因此,其分配需要从价格的分配和数量的分配中得出。这也使它与讨论价格和数量而不是回报的其余经济学保持一致。
因为股票是通过双重拍卖出售的,所以没有赢家的诅咒,因此,理性的行为是为持续经营出价期望值。使用许多买卖双方的标准均值假设,随着期望数的增加,期望的分布将收敛于高斯分布。如果将均衡价格视为(0
因为密度被截断为-100%,所以位置的中心就是模式。那是回归的非常不同的概念。它还对人工智能有影响。AI模型是函数逼近器,但是危险是它们逼近最小二乘解而不是贝叶斯模态解。机器学习和AI的许多标准最小化保证了其构造不会错过贝叶斯解决方案。
这也带来了信息问题。Cauchy分布和截断的Cauchy分布缺少点,这些点对于任何一个参数都是足够的统计量。尽管它们的关键量足够大并且对于柯西分布是正态分布的,但对于截断柯西分布却可能不是,并且在辅助统计量的条件使推论有效时,这对投影没有用。
拟议的演算通过注意后验预测密度包含每个点的整个后验效应(通过边缘化),在贝叶斯模型中解决了这一问题。使用预测性分布不会造成信息丢失。它为频率演算提供了两种可能的解决方案。这是一个推测,有两个原因。
首先是它们建立在频繁性预测间隔上,而预测间隔是建立在置信度程序上的。如上所述,置信度过程不是唯一的,即使数据不变,假设的更改也会从本质上改变预测的分布。我把它作为一个推测保留下来,以便度量理论家可以将其拆散。但是,贝叶斯方法不是一个猜测。第二个原因是,最初的推测方法取决于开放时间间隔,许多标准结果都崩溃而没有紧凑性。
新演算与它所基于的贝叶斯决策理论的不同之处在于,它使用间接效用函数构造了一个客观估计量。尽管贝叶斯决策理论适当是纯粹主观的,但这提供了一种解决方案,可以根据先验密度中的信息来得出客观的解决方案。也可以赌博。我希望也能在此博客中建立期权定价模型。它已经完成,但是我正在对其进行编辑以更好地适应微积分。
1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Frequentist Mandelbrot 资本资产定价模型 FREQUENT SCHOLES

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-24 07:00