楼主: 何人来此
1235 42

[量化金融] 多重分形扩散熵分析:最优的网格宽度 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-5 11:03:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Multifractal Diffusion Entropy Analysis: Optimal Bin Width of
  Probability Histograms》
---
作者:
Petr Jizba and Jan Korbel
---
最新提交年份:
2014
---
英文摘要:
  In the framework of Multifractal Diffusion Entropy Analysis we propose a method for choosing an optimal bin-width in histograms generated from underlying probability distributions of interest. The method presented uses techniques of R\\\'{e}nyi\'s entropy and the mean squared error analysis to discuss the conditions under which the error in the multifractal spectrum estimation is minimal. We illustrate the utility of our approach by focusing on a scaling behavior of financial time series. In particular, we analyze the S&P500 stock index as sampled at a daily rate in the time period 1950-2013. In order to demonstrate a strength of the method proposed we compare the multifractal $\\delta$-spectrum for various bin-widths and show the robustness of the method, especially for large values of $q$. For such values, other methods in use, e.g., those based on moment estimation, tend to fail for heavy-tailed data or data with long correlations. Connection between the $\\delta$-spectrum and R\\\'{e}nyi\'s $q$ parameter is also discussed and elucidated on a simple example of multiscale time series.
---
中文摘要:
在多重分形扩散熵分析的框架下,我们提出了一种从感兴趣的潜在概率分布生成的直方图中选择最佳仓位宽度的方法。该方法利用R\\{e}nyi熵和均方误差分析技术讨论了多重分形谱估计误差最小的条件。我们通过关注金融时间序列的标度行为来说明我们方法的效用。特别是,我们分析了1950-2013年期间以日利率抽样的标准普尔500指数。为了证明所提出的方法的优点,我们比较了不同仓位宽度下的多重分形$\\delta$-谱,并展示了该方法的鲁棒性,尤其是对于$q$的大值。对于这些值,其他正在使用的方法,例如基于矩估计的方法,往往无法用于重尾数据或具有长相关性的数据。在一个简单的多尺度时间序列的例子中,还讨论并阐明了$\\delta$谱与R\\\'{e}nyi的$q$参数之间的关系。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Mathematical Physics        数学物理
分类描述:Articles in this category focus on areas of research that illustrate the application of mathematics to problems in physics, develop mathematical methods for such applications, or provide mathematically rigorous formulations of existing physical theories. Submissions to math-ph should be of interest to both physically oriented mathematicians and mathematically oriented physicists; submissions which are primarily of interest to theoretical physicists or to mathematicians should probably be directed to the respective physics/math categories
这一类别的文章集中在说明数学在物理问题中的应用的研究领域,为这类应用开发数学方法,或提供现有物理理论的数学严格公式。提交的数学-PH应该对物理方向的数学家和数学方向的物理学家都感兴趣;主要对理论物理学家或数学家感兴趣的投稿可能应该指向各自的物理/数学类别
--
一级分类:Mathematics        数学
二级分类:Mathematical Physics        数学物理
分类描述:math.MP is an alias for math-ph. Articles in this category focus on areas of research that illustrate the application of mathematics to problems in physics, develop mathematical methods for such applications, or provide mathematically rigorous formulations of existing physical theories. Submissions to math-ph should be of interest to both physically oriented mathematicians and mathematically oriented physicists; submissions which are primarily of interest to theoretical physicists or to mathematicians should probably be directed to the respective physics/math categories
math.mp是math-ph的别名。这一类别的文章集中在说明数学在物理问题中的应用的研究领域,为这类应用开发数学方法,或提供现有物理理论的数学严格公式。提交的数学-PH应该对物理方向的数学家和数学方向的物理学家都感兴趣;主要对理论物理学家或数学家感兴趣的投稿可能应该指向各自的物理/数学类别
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--

---
PDF下载:
--> Multifractal_Diffusion_Entropy_Analysis:_Optimal_Bin_Width_of_Probability_Histograms.pdf (606.76 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Mathematical Multifractal Applications formulations Quantitative

沙发
可人4 在职认证  发表于 2022-5-5 11:03:31
Physica A 00(2018)1–22 Physica Amultivulation Diffusion熵分析:可能性历史的最佳仓位宽度Petr Jizbaa,b,Jan Korbela,核科学与物理工程学院,布拉格捷克技术大学,布拉格,布拉格,捷克共和国理论物理研究所,柏林弗雷大学,Arnimalle 14195,德国CMAX普朗克科学史研究所,波尔兹曼大街22号,14195柏林,德国摘要在多重分形扩散熵分析的框架下,我们提出了一种方法,用于选择从潜在概率分布生成的历史图中的最佳仓位宽度。该方法利用R′enyi熵和均方误差分析技术讨论了多重分形谱估计误差最小的条件。通过关注金融时间序列的标度行为来说明我们方法的效用。特别是,我们分析了1950-2013年期间以日利率抽样的标准普尔500指数。为了证明所提出方法的强度,我们比较了不同仓宽的多重分形δ谱,并展示了该方法的稳健性,尤其是对于较大的q值。对于此类值,使用的其他方法,例如基于矩估计的方法,对于重尾数据或具有长相关性的数据,往往失败。本文还以一个简单的多尺度时间序列为例,讨论并阐明了δ谱与R′enyi的q参数之间的关系。C 2014年由爱思唯尔有限公司出版。关键词:多重分形、R’enyi熵、稳定分布、时间序列ACS:89.65。生长激素,05.45。Tp1。引言自然科学、经济科学、医学和生物科学中许多复杂系统的演化通常以时间数据序列的形式呈现。

藤椅
mingdashike22 在职认证  发表于 2022-5-5 11:03:35
随着计算机在全球范围内的大规模应用,以及它们收集和处理大型数据集的能力的提高,人们对新的分析方法产生了需求。最近,大量文献致力于开发和使用新的数据分析范式。这些研究包括分形和多重分形[1]、分数动力学[2,3]、复杂性[4,5]、熵密度[5]或转移熵[6,7,8]等概念。特别是在金融时间序列方面,测量和管理经验高频数据序列的分形和多重分形标度行为的技术发展迅速。时间数据集中的非平凡标度行为代表了多时间尺度合作行为的典型特征,这与二阶相变中的非平凡标度行为反映潜在的长程(或多尺度)合作相互作用的方式大致相同。例如,在量化关键或接近关键的标度时,标度方法的有用性是非常高的,这通常标志着金融危机的开始,包括股市崩溃、货币危机或主权违约[9]。多重分形缩放,尤其是电子邮件地址:p。jizba@fjfi.cvut.cz(彼得吉兹巴),korbeja2@fjfi.cvut.cz(Jan Korbel)P.吉兹巴和J。

板凳
mingdashike22 在职认证  发表于 2022-5-5 11:03:39
Korbel/Physica A 00(2018)1–22 2有助于确定涉及时间和资产间相关性的相关量表[8]。顺便提一句,除了财务数据序列外,在心率动力学[10,11]、DNA序列[12,13]、长期天气记录[14]或电力负荷[15]的时间数据集中,还观察(和分析)了类似的(多重)分形标度模式。为了识别复杂系统(确定性和随机性)生成的时间序列中的分形和多重分形标度,随着时间的推移,已经开发了几种工具。最流行的是去趋势波动分析[12,16]、小波[17]或广义赫斯特指数[18]。本文的目的是讨论并提出另一种相关的方法,即多重分形差异分析(MF-DEA)。在这样做的过程中,我们将强调r^ole,r^enyi的熵(RE)在这方面发挥的关键作用。为此,我们将采用两种方法来估算可直接用RE表示的标度指数,即Scafetta等人[19]的单分形方法和Huang等人的多重分形方法。[20] ,以及莫罗佐夫[21]的进一步评论。本研究得出的最重要的结论是,在经验直方图中提出了最佳箱宽的建议。后者确保了当基本概率密度函数(PDF)被其经验直方图取代时,RE(因此也是标度指数)评估中的误差在R’enyi信息散度和相关L距离的意义上是最小的。

报纸
nandehutu2022 在职认证  发表于 2022-5-5 11:03:43
我们进一步证明,由此产生的最佳仓位宽度允许以完全定量的方式表征多重分形标度指数δ(q)和D(q)的层次结构。本文的结构如下:在第2节中,我们简要回顾了多重分形分析的基础,这些基础将在接下来的章节中用到。特别是,我们引入了Lipschitz–H–older的奇异指数、多重分形谱函数及其Legendre共轭等概念。在第3节中,我们陈述了波动收集算法的一些基本原理,并提出了一个关于异构多尺度时间序列的简单示例。在此框架内,我们讨论了MF-DEA,并强调了r^enyi熵作为多尺度量化器的作用。在这篇准备材料之后,我们在第4节讨论了在经验直方图中应该采用的最佳仓宽选择问题。特别是,我们分析了多重分形谱评估中最小化误差所需的bin。在第5节中,我们通过分析1950年1月至2013年3月期间(约16000个数据点)以每日(交易日结束)利率抽样的标准普尔500指数的时间序列,证明了所提出的误差估计的有用性和形式一致性。我们使用开源软件R进行符号计算,以说明所提出的最佳箱子宽度选择的优势。特别是,我们以图形方式比较了不同仓宽的多重分形δ谱。我们的数值结果表明,与使用的其他替代方案相比,所提出的料仓宽度确实是最优的。还讨论了δ(q)谱作为R′enyi q参数函数的含义,并用图形表示。结论和进一步的讨论被归入结论部分。

地板
kedemingshi 在职认证  发表于 2022-5-5 11:03:46
为了方便读者,我们在附录A中提供了语言R的源代码,可以直接用于有效估计长期数据序列的δ(q)谱(并确保广义维数D(q))。2.多重分形分析让我们有一个离散时间序列{xj}Nj=1 RD,其中xjare是从时间tj的测量中获得的,具有一个相等的时间滞后s。我们将xj的整个定义域划分为不同的区域K,并确定每个区域的概率为≡ 画→∞NiN=limN→∞卡片{j∈ {1,…,N}|xj∈ Ki}N,(1)其中“card”表示基数,即集合中包含的元素数。对于每一个区域,我们认为概率的尺度为pi(s)∝ sαi,其中αi是标度指数,也称为Lipschitz–H–older(或奇异性)指数。多重分形分析中的关键假设是,在小s极限下,我们可以假设概率分布平滑地依赖于α,因此可以在公式dρ(s,α)=limN中考虑某个任意区域在区间(α,α+dα)内具有标度指数的概率→∞卡片{pi∝ sα′|α′∈ (α,α+dα)}N=c(α)s-f(α)dα。(2) P.Jizba和J.Korbel/Physica A 00(2018)1–22 3相应的标度指数f(α)被称为多重分形谱,通过其定义,它代表了带有标度指数α的PDF子集的(盒计数)分形维数。跟踪各种pi的一种简便方法是检查相应时刻的比例。为此,我们可以定义一个“配分函数”Z(q,s)=Xipqi∝ sτ(q)。(3) 在这里,我们引入了标度函数τ(q),它是热力学自由能的一个类似物[22,23]。本质上是配分函数(3),除了(q- 1) 概率分布的第阶矩,即Z(q,s)=e[Pq-1(s)]。

7
大多数88 在职认证  发表于 2022-5-5 11:03:50
有时引入随机变量X={xi}asE[X]f=f的广义平均值是很方便的-1.Xif(xi)pi. (4) 函数f也称为Kolmogorov–Nagumo函数[22]。对于选择f(x)=xq-1一个获得所谓的q-平均值,通常表示为E[··]q。然后通常引入q-平均值asE[P(s)]q=q的标度指数D(q)-1pE[Pq-1(s)]∝ sD(q)。(5) 这种D(q)被称为广义维数,从(3)中,它通过关系与τ(q)相连:D(q)=τ(q)/(q)- 1).在某些特定情况下,广义维数可以与其他已知的分形维数相识别,例如,对于q=0,我们有通常的盒计数分形维数,对于q→ 1我们有信息维度,当q=2时,它对应于关联维度。广义维数本身可以从关系式d(q)=lims中获得→0q- 1ln Z(q,s)ln s,(6)这促使了R’enyi的entropyHq(s)=1的引入- qln Z(q,s)。(7) 通过(6)定义的广义维数也被称为q阶的R’enyi维数。等式(7)反过来意味着,对于小s,有Hq(s)~ -D(q)ln s+CQ,其中CQ是独立于s的术语(参见参考文献[22])。多重分形谱f(α)和标度函数τ(q)不是独立的。它们之间的关系可以从配分函数的表达式中找到,在(1)和(2)的帮助下,可以等价地写成z(q,s)=Zdαc(α)s-f(α)sqα。(8) 通过采用最陡下降近似,我们发现τ(q)=qα(q)- f(α(q))。(9) 这里α(q)是奇点指数的一个值,它使qα最大化- f(α)对于给定的q。结合可微性假设,我们发现α(q)=dτ(q)/dq,因此等式(9)只不过是两个共轭对(α,f(α))和(q,τ(q))之间的勒让德变换。

8
能者818 在职认证  发表于 2022-5-5 11:03:53
函数τ(q)的勒让德变换f(α)包含与τ(q)相同的信息,并且是处理多重分形时通常研究的特征[17,20,22,23]。顺便说一句,我们可以观察到,从多重分形到单分形的过程是通过假设α区间变得非常窄,并且基础PDF是平滑的来完成的。在这种情况下,α和f(α)都崩溃为α=f(α)≡ D和q=df(α)/Dα=1(参见参考文献[22])。Pq-1是一个概率和值等于pq的随机变量-1i。在这里和整个过程中,我们都使用自然对数,从信息的角度来看,更自然的做法是通过对数将RE表示为基数2。因此,重新定义的单位是自然单位——纳特,而不是比特。P.Jizba和J.Korbel/Physica A 00(2018)1-22 43。差异熵分析3。1.波动收集算法为了能够利用RE提取标度指数,我们需要从给定的经验数据序列中正确估计概率分布。对于我们来说,特别有用的方法是所谓的Luctuation collection algorithm(FCA)[19]。为了理解所涉及的内容,让我们假设{xj}Nj=1是一个平稳时间序列。通过将时间序列视为一组一维产生扩散的扩散,可以将其转换为随机游动(即扩散轨迹)。利用时间斜纹beξ(t)=PMi=1xi时的“粒子”位置进行差分。这里t=Ms和M≤ N和s是基本的时滞。使用类随机行走过程而不是原始(类噪声)数据时间序列的原因是中心极限定理(CLT)及其L’evy–Gnedenko重尾推广[13,24]。

9
nandehutu2022 在职认证  发表于 2022-5-5 11:03:58
事实上,CLT吸引盆地中随后的分布允许识别(并量化)辅助扩散过程中烙印的真正普遍的标度行为。这是因为非平凡标度可以用所涉及的L′evy稳定非高斯分布的参数来表述。通常,时间尺度间的相关性通常会导致CLT在全球范围内崩溃,但在许多情况下,CLT的有效性至少会在局部保持。在这种情况下,L′evy标度参数取决于局部时间尺度,这反过来导致在复杂动力系统产生的时间序列中出现典型的多重分形图。下一小节将介绍这种行为的一个例子。为了确定可能存在的标度,我们需要知道在时间s=ns(n)时在位置x处发现辅助微分的概率,即满足条件1的整数≤ N≤ N) 。FCA通过将一个时间序列,或者更好地将导出的扩散轨迹转换为一组扩散轨迹,精确地解决了这个问题。为此,我们定义- n+1亚序列{x(κ)j}nj=0,其中x(κ)j=xj+κ,κ=0,M- n,j=1,n,x(κ)≡ 0, κ = 0, . . . , M- N(10) 特别是,上述每个子序列都有持续时间s。可以设想,具有不同κ的子序列是通过在原始时间序列中将固定长度s的窗口移动恒定量s而形成的。很明显,只有N-n+1这样的转变是可能的。因此,这种子序列的选择被称为移动窗口方法[25]。从任何子序列{x(κ)j}nj=0可以形成一个辅助扩散轨迹(基本上是一个样本路径),如ξ(κ)(s)=nXj=0x(κ)j=nXj=0xj+κ。

10
kedemingshi 在职认证  发表于 2022-5-5 11:04:02
(11) 将时间序列映射到扩散过程会产生重叠的扩散过程。suchN乐队-s+1扩散轨迹现在可以找到所需的概率;对于不同的κ,所有获得的ξ(κ)(s)值被划分为长度为kih(s)的区域,概率由(标准化的)等距直方图估计,即^pi(s)≡卡片{t|ξs(t)∈ 基恩- n+1。(12) 图1用S&P500指数的时间序列说明了上述FCA。对于多维数据系列,即{xj}Nj=1 RD,我们用元素体积hD的超立方体箱估计D维直方图。不幸的是,目前FCA没有规定h(s)的大小,但这对正确的重新评估至关重要。在下面的小节中,我们将看到,通常s=s(q),因此最佳仓宽H通常取决于q。在第4节中,我们将讨论h(q)的实际最优值。显然,FCA不适用于非遍历和非马尔可夫系统的情况,例如通过加速、路径依赖或老化随机游动。这是因为,整个函数集合构造背后的关键假设是吉布斯系综方法的可靠使用,而只有当所讨论的时间序列代表基础系统的时间演化时,该方法才是正确的,其复杂的统计规则不会随时间变化。为了简单起见,将在sectionsP中使用FCA的这个有限框架。Jizba和J.Korbel/Physica A 00(2018)1–22 50 5000 10000-0.20 0.001950-2013Index0 50 100 150 200 250-0.05 0.052008Index0 10 20 30 40-0.08 0.00 s=8在2008年1月和2月期间的波动收集指数0.08-0.5-0.2 0.1 s=64在20080 20 60历史图中的变化收集图1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 04:26