楼主: 大多数88
2266 73

[量化金融] 从大数据到重要信息 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-11 04:30:54
材料的不同部分基本上是相同的,使其光滑,任何(局部)原子属性的平均值都有一个明确的数字。然而,在临界点,密度在类水和类蒸汽条件之间波动,因此材料不光滑,并且材料作为一个整体的平均值不能代表任何特定位置或时间的密度。按确定温度盖(冰)液体(水)气体(水蒸气)临界温度临界压力临界点图。2:水的相图。液态水和水蒸气之间的转换线在临界点(红点)处停止。在这一点上,类液体密度和类蒸汽密度之间的波动延伸到整个系统,因此系统不平滑(违反了微积分的假设),平均值表现不好(违反了统计假设)。为了解决这个问题和类似的问题,开发了一种考虑跨尺度行为的新方法——重整化群。在临界点附近,物质由密度较低和较高的斑块组成,这种斑块出现在所有尺度上,甚至在宏观尺度上。为了从数学上解决这个问题,成立了标准化小组[5]。在重整化群方法中,我们在多个尺度(分辨率水平)上考虑系统。在一个分辨率水平上,空间变化的宏观密度通过执行局部平均而不是全球平均,在更大范围内与之相关。这种平均将一个观测尺度下的自由能与更大尺度下的自由能联系起来。该系统的特性可以从行为如何随规模而变化(以任意大(有限)规模为限制)中找到。数学并不容易,但它产生的指数与现象学一致[4,5,10]。

12
能者818 在职认证  发表于 2022-5-11 04:30:57
自发展以来,重整化方法在解决材料结构和动力学问题方面取得了许多进展[16,17]。得到不同结果的原因是,在这种情况下,自由能不仅仅是平均密度的函数。不过,没有必要考虑单个原子之间的相互作用。对于正在转变为蒸汽的液体,自由能取决于密度的空间变化,即不同位置的局部密度如何相互作用。局部密度之间存在许多可能的相互作用,这些相互作用有助于产生自由能。然而,只有其中一些是重要的。重整化群是一种确定描述相互作用的哪些参数重要,哪些参数不重要的方法。“相关”参数是指自由能随尺度增加的参数;“不相关”参数是指那些随着规模而减少的参数。因为物质中有许多原子,不相关的参数不能影响我们的观察。我们只能考虑相关参数。我们可以从微观上测量不相关的参数,但它们不会影响材料的宏观变化,也不会影响我们在临界点附近与材料的相互作用。四、 表示和信息作为尺度的函数为什么基于微积分和统计学的朗道理论失败了?问题不在于自由能的最小化,而在于物质的表现。假设自由能可以写成平均密度的函数,这是行不通的。单个变量无法捕捉材料中发生的情况。另一方面,并不需要所有原子的位置。密度的空间模式是我们所需要的。此外,我们看得越近,我们需要的密度值就越多。

13
mingdashike22 在职认证  发表于 2022-5-11 04:31:00
我们表现系统的方式是问题的关键——在我们选择的观察尺度上表现的效率。表示法是系统到数学变量的映射。更准确地说,应该将表示理解为系统可能状态集到数学变量可能状态的映射。一个忠实的代表必须拥有与其所代表的体系相同的状态数。这使表示的状态能够一一映射到系统的状态。如果一个模型的状态比系统少,那么它就不能代表系统中发生的一切。如果一个模型有更多的状态,那么它代表的是系统中不能出现的东西。传统模型通常不考虑这一点,这导致系统和模型不匹配;它们是不忠的陈述,不能正确地识别系统的行为,从而最终确定其对我们可能考虑的环境力量或干预的反应。因为我们对影响系统感兴趣,所以我们只想知道重要的区别。我们必须把注意力集中在那些在特定的观察尺度上可以区分的状态上。为了将这些想法形式化为复杂系统,理解与规模相关的信息是很有用的。我们将复杂度文件[1,14]定义为表示一个系统作为尺度函数所需的信息量。信息论将消息中的信息量定义为消息可能数的对数(以2为底),即表示可能消息集所需的位数。因此,复杂度由特定规模下系统的可能状态数给出。

14
mingdashike22 在职认证  发表于 2022-5-11 04:31:03
通常,对一个系统的查询规模越大,描述它所需的信息就越多(图3)。复杂的规模信息最重要的是大规模行为所有细节信息。3:复杂度是描述系统所需的信息量,是描述尺度的函数。通常,更大的规模需要更少的细节,因此信息量更小。关于一个系统,最重要的信息是最大规模的行为。由于量子不确定性,在最小尺度上是有限的,等于一个普适常数,1/kBln(2),乘以平衡系统的熵,其中kb是玻尔兹曼常数[15]。单个实数在其表示的所有有限位数中都有无限可能。因此,它能够表示有限数量的信息。这似乎表明我们可以用一个单实数来表示一个系统。例如,一个代表液体密度的数字具有有限的信息,但我们从相变中知道,这个数字是不够的。为什么这不管用?问题在于,信息在实数中按比例组织的方式与它在系统中的方式不一致。实数可以表示点在一维上的位置。假设我们从知道物体的位置开始,1个单位长度的解。将分辨率提高两倍意味着我们可以区分长度为1/2单位的两个可能段中的哪一个。传递此信息需要一个二进制变量。分辨率每增加2倍,我们就有2种额外的可能性可以指定。比特数是分辨率刻度的对数(以2为底)。

15
可人4 在职认证  发表于 2022-5-11 04:31:06
然而,对于处于临界点的液体,比特数随着分辨率的增加而不同地增加。随着分辨率的增加,我们必须描述密度的变化。比特数的增长速度比分辨率为2的每因子1比特更快(见图4)。因此,一个有效的表示是,在resox=0的每个级别上,有一组可能的状态,对应于系统的一组可分辨状态。d1d2d3d4d5d6。。。y=0。d1d2d3d4d5d6。。。e1e2e3e4e5。。。f1f2f3f4。。。g1g2g3。。。h1h2。。。图4:一个实数(x,顶部)有很多数字,这增加了可用信息量ata速率,这是两个因素的每一次尺度变化的两种可能性。实数并不能很好地表示信息量随尺度(y,底部)不同而增长的系统。作为尺度函数的位数由图3的复杂度曲线表示。lution,我们需要描述我们关心的相关参数的属性,并且不需要进一步描述。在考虑影响系统大规模特性的干预措施时,而不是积累系统的细节,我们应该从最大规模的行为模式开始,只在需要时添加额外信息。根据复杂度报告,关于一个系统的每一条信息都有一个最大的范围,我们可以在这个范围内开始检测这条信息。因此,一般来说,我们关注的是将信息描述为尺度函数的系统(图3)[1]。直观地说,随着规模的扩大,我们需要的信息越来越少。当信息中存在作为尺度函数的平台时,我们有明显的尺度分离情况。在二阶相变中,我们有一个幂律行为,它是尺度的函数,扩展到系统的大小。

16
mingdashike22 在职认证  发表于 2022-5-11 04:31:10
没有尺度的分离。在物理学中,重整化群的使用不同于我们对复杂系统感兴趣的东西,也不同于通过复杂度文件对其进行形式化。重整化群大约是最大的“热力学”尺度,即有限尺寸极限。然而,在考虑复杂系统的行为时,我们感兴趣的是利益行为发生的系统规模,即人类健康或社会经济活动。有限尺寸限制并不总是考虑这些系统的有用方法。重整化群也用系统的能量来描述。出于我们的目的,我们想要识别的属性是系统的一组可区分状态,它们在特定的尺度上表征了系统的动态行为。尽管如此,重整化群的方法论不仅仅是概念。我们获得了关于如何基于组件聚合构建模型以识别相关变量的正式指导。随着规模的扩大,我们看到的细节越来越少。小的差别消失了,只有涉及系统许多部分的更大差别仍然存在。部分骨料的性质如何决定所观察到的情况,即1WaveGaussianNavier-Stokes1:10.21:10.31:20.2A-S1:1A-S1:2A-S1:41:10.21:10.31:20.2Fig。7.2.13(第一)图7.2.13(第二)图7.2.14图。7.2.15图。7.2.16(第一)图7.2.16(第二)02004000600800100001:11:21:4在模式下按顺序排列图。5:当我们关注最大规模时,系统行为映射到简化的模型上,每个模型都适用于一组可能的系统,这些系统具有广泛不同的显微镜细节。

17
大多数88 在职认证  发表于 2022-5-11 04:31:13
图中显示的例子包括:高斯分布、波动、有序-无序转变(本文讨论的相变主题)、图灵模式、Navier-Stokes方程描述的流体流动、吸引子动力学。只有少数几个模型能够捕捉广泛系统的行为,这就构成了普遍性的概念,即系统是行为的普遍性类别的成员。什么是重要的。通过研究属性聚集的方式,我们可以识别出重要的大尺度系统属性。聚合是由各部分相互依赖的方式决定的。最简单的情况是当部件完全独立或依赖时;在前一种情况下,聚合是我们从统计学中知道的,它会产生正态(高斯)分布所描述的平均值和随机偏差,而在后一种情况下,会产生单一的相干行为。如下一节所述,当存在其他类型的依赖时,会出现不同的行为。其中包括动态振荡和空间模式等行为(图5)。V.普适性、正态分布和超越当我们研究一个系统的最大规模行为时,我们简化了系统的数学描述,因为可分辨状态较少,所以可能发生的行为集合非常有限。这也意味着,在微观尺度上看起来不同的系统在宏观尺度上可能看起来不同,因为它们的数学描述变得相同。一个例子是,将液体沸腾为气体时的转变与将磁铁加热到非磁性(铁磁体到顺磁性转变)时发生的转变具有相同的性质。这既不是巧合,也不仅仅是类比,而是一种直接的数学关系。

18
kedemingshi 在职认证  发表于 2022-5-11 04:31:17
磁铁的局部磁化强度在磁临界点处发生变化,就像水蒸气临界点处的密度一样。正如水分子随着温度的升高而经历从有序到无序的转变一样,小磁铁也经历了从有序到无序的转变。局部磁化相互作用,就像临界点处水中的密度变化一样。结果是,这两个看似不同类型的系统在数学上相互映射。水蒸气转变到磁转变的映射说明了一种行为如何描述许多可能的系统。随着重整化群的应用越来越广泛,人们发现许多系统具有相同的行为,尽管它们在细节上有所不同,这一概念被称为普适性。尽管如此,尽管许多系统具有相同的行为,但也有一些系统具有不同的行为人。这意味着系统可以分为不同的行为类别,这就产生了“通用类”这个术语幂律通常出现在跨尺度行为的背景下,指数的值被用作普适性类的标志[4,5,9,10]。从某种意义上说,许多系统都可以用相同的大规模行为来描述,这一观点在传统理论中得到了应用。科学家对许多不同的生物和社会系统使用正态分布。任何具有充分独立分量的系统都满足中心极限定理的公理,并且可以用相同的聚合行为(即正态分布)进行数学描述。当存在依赖项时,正态分布不再适用,但存在其他类型依赖项所特有的其他行为。

19
可人4 在职认证  发表于 2022-5-11 04:31:20
为了研究这些行为,我们必须确定各种依赖关系导致各种大规模行为的方式。甚至还有更基本的方法可以用来描述系统的一般数学描述,即点粒子运动用来描述许多远物体的运动,波动方程用来描述从音乐弦到水波到光的一切。尽管具体的系统非常不同,但导致其行为的依赖关系以及行为本身在数学上是相关的。我们可以更普遍地考虑复杂系统的普适性。为了从重整化群推广普适化的思想,我们没有考虑有限系统大小和幂律指数的宏观极限。相反,我们代表的状态必须与系统在观察尺度上的状态相对应。此外,我们没有像物理学中的相变那样用这些状态来描述自由能,而是用它们来描述动力学,以及系统对外力的响应。任何方程的基础都是一个假设,即所使用的变量是系统的有效(有效)表示。相关参数是那些在特定观测尺度下很重要的参数,由观察者的可分辨性决定。一个系统在特定尺度上的数学表示也可能对应于其他系统的行为。这些系统可能有相当不同的底层组件。这是普遍性的一般概念(图5)。热力学极限不能揭示普遍性的情况有哪些?图灵图案[26]中发现的一个重要例子是图案形成,大致(但不完全)是周期性斑点或条纹的空间阵列。

20
可人4 在职认证  发表于 2022-5-11 04:31:23
这些模式可以在许多方面出现,例如,通过使用化学物质的二氟反应[27]。在足够大的尺度下,这些图案看起来只有灰色。这种情况下,系统行为发生在有限的范围内,自由度在足够大的范围内消失。尽管如此,我们仍然可以将这些描述性变量从一个系统映射到另一个系统。这些模式代表具有特定规模结构的系统的通用行为类。重要的是,这些图案来自一系列可能的微观行为,但它们对细节不敏感,因为图案的规模更大,因此是分开的。虽然需要一些参数来描述形成的各种图案,但这些参数远少于微观材料细节中的参数。构成它们的物质的微观变化只会在改变相关参数的程度上改变模式,并且只有通过它们如何影响这些相关参数才能理解。在普适性概念中包含图灵模式是统计物理学中普适性概念的自然而重要的推广。这些模式随相关参数的变化,以及它们对环境条件的响应,可以研究并与唯象观测相关。在这些观察尺度下,有预测互动的能力。这些问题并非微不足道,因为它们给数学和观察研究带来了挑战。采用图灵的生物学思想来描述动物皮肤上的图案和更普遍的形态发生一直存在争议[28,29],正是因为图案动力学没有捕捉微观机制。这场争论忽略了关于普遍性的关键点。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 14:11