楼主: nandehutu2022
1465 38

[量化金融] 利用经济物理学对收入、财富和支出数据进行建模 [推广有奖]

21
能者818 在职认证  发表于 2022-5-11 03:36:42
如果无法收集调查数据,可以匹配来自不同来源的记录或信息,以便进行推断。大多数用户期望数据提供者在家庭收入的宏观总量和与人口总数相匹配的微观收入统计数据之间进行调节。如果不可能做到这一点,则当已知存在差异时,数据生产者应提供解释。这种核对,以及对任何差异的明确解释,是国家统计局的最佳做法。收入分配统计数据和国民账户之间的可比性最大化有几个原因。首先,收集的任何数据集都可能用于多种用途。例如,在国民账户估算的编制或基准测试中使用微观数据。其次,在不同框架下编制的统计数据用于相互检查过程,用户可以使用不同的数据集进行分析。12转账是指收款人不给予任何补偿的收据。转账可以包括现金(在货币意义上)、商品或服务,也可以在国内外的家庭之间、家庭与ZF之间、家庭与慈善机构之间进行。其目的是通过ZF(如养老金)或私人(如子女抚养)重新分配收入。纵向(或面板)数据通过采取更长期、动态的观点来更好地理解收入。它显示了这种状态随时间的持续性,以及进入和退出这种状态的转换。幸福的概念需要处理收入、财富和消费。

22
可人4 在职认证  发表于 2022-5-11 03:36:45
这些概念与描述人们所接收、拥有或使用的资源的总经济价值有关。然而,收入只提供了经济福祉的部分观点。收入作为一种流动衡量标准,有时是不稳定的。财富作为一种存量指标,随着时间的推移更加稳定,反映了随着时间的推移积累的储蓄和投资,这些储蓄和投资可以在需要时动用。财富储备也可以用来创造收入。财富可以存在于不容易转化为货币的资产中,它的存在可能会让人们借钱来支付支出。平均收入、消费和财富是有用的统计数据,但不能提供生活水平的全貌。例如,平均收入的增加可能会在不同群体之间分配不均,导致一些家庭的境况相对较差。收入、消费和财富的平均衡量标准应附有反映其分布的指标[29]。1.5用于收入、财富和支出分配的统计力学分布的文献综述和理论框架使用统计物理方法研究收入分配有着悠久的历史[30]。帕累托在1897年提出,收入分配将遵循一条适用于所有时代和国家的普遍权力法[31]。后来的作者Shirras[32]对此提出了质疑。Mandelbrot[33]提出了一个“弱帕累托定律”,该定律只适用于高收入人群。在这种形式下,帕累托分布不适用于描述大多数人口。帕累托还提出了许多其他收入分配方式:利维、对数正态、香槟、伽马和其他两种形式[34]。

23
nandehutu2022 在职认证  发表于 2022-5-11 03:36:48
社会经济和统计这两个学派找到了这样做的理由。前者使用经济、政治和人口统计的理由来解释收入分配[35],而后者则使用随机过程。Gibrat[36]在1931年提出了对数正态分布,考虑到收入是基于乘法随机过程的。因此,蒙特罗尔和施莱辛格继承了这些思想[37]。然而,Kalecki[38]指出,这种分布的宽度不是静止的,而是随着时间的推移而增加的。Levy和Solomon[39]提出了一个低收入的截止线,将分配稳定到幂律。现代经济物理学家[39-41]在财富和收入分布的理论建模中也使用了不同版本的乘法随机过程。一个最精确的例子是由Dragulescu和Yakovenko[16]提出的物理学中的热隔离系统和经济学中的封闭宏观经济系统组成。因此,来自气体的粒子的能量可以被认为是每种物质所拥有的金钱的类似物。然而,如今的经济是由开放的自由市场组成的,在那里进行交易,因此代理人和资金的数量随着时间的推移而变化。鉴于开放市场经济的这一特点,对这种情况最好的描述是大正则系综。因此,大正则系综的特征是能量和粒子数的变化,即使包含系统的能量和粒子数的平均值是固定的。为了继续这两个领域之间的类比,我们将市场快照作为微观状态,将其平均值作为宏观状态。

24
mingdashike22 在职认证  发表于 2022-5-11 03:36:51
从大量市场微观状态中获取平均值的过程包括获取特征参数的平均值。鉴于市场是一个复杂的系统,有大量的自由度,而且许多联系并不总是完全清楚,长期的市场演变是不可预测的,因此是混乱的。此外,经济系统的组成粒子通常是混沌的(因为大多数交易都是随机发生的),因此热力学系统中这种混沌行为的类比可以用遍历假设来表示。随后,市场在给定的时间间隔内通过所有可能的状态。因此,就像在统计物理学的情况下一样,市场的混沌特性使得有可能用某个集合交易商品在固定时间的平均值代替单个系统的时间平均值,而每个成员在其全球宏观属性方面与集合相同[42-43]。到目前为止,经济物理学的目标是分析和预测金融市场和金融数据。最近,经济物理学中出现了一个新领域,涉及宏观经济总量,如收入、财富和公司规模[1-2]。这是一个传统上属于经济学的领域[21]。因此,2000年发表了三篇关于货币和财富分配的主要论文[16],[44-45]。收入分配的数量特征是经济学中一个长期存在的问题。首先解决这个问题的是帕累托分布,这是最广泛的分布。雅科文科和德拉古列斯库[16]引入了与玻尔兹曼-吉布斯分布类似的指数分布。Chakraborti等人。

25
可人4 在职认证  发表于 2022-5-11 03:36:54
[44]提出了封闭经济系统的理想气体模型,该模型的特点是资金和代理人数量固定。Chatterjee等人[46]介绍了物理学家开发的动力学交换模型,以了解其原因并制定收入不平等的补救措施。克莱门蒂等人[47-49]使用k-广义分布作为收入规模分布的描述模型。对数正态分布也是另一个成功应用于中低收入人群的分布。Moura Jr.和Ribeiro[50]表明,Gompertz曲线与帕累托幂律相结合,可以很好地描述整个收入分配。Tsallis[51]是另一种声称适合整个收入范围的分配。席尔瓦和雅科文科[52]展示了一个非常重要的事实,即社会是两级结构的,尽管这只是针对美国的案例。因此,大多数人口都属于较低阶层(97-99%),并且在时间上具有非常稳定的指数特征。上层阶级(占人口的1-3%)具有幂律分布。此外,这些参数随着时间的推移会发生显著变化,这取决于股票市场的演变。雅科文科和德拉古列斯库利用指数累积分布函数和概率密度函数[16]、[40]、[53-60]对收入分配进行了不同的测量,考虑了近年来不同国家(主要是发达国家)以年值表示的平均可支配收入。因此,使用对数-对数标度对低收入人群进行分析,对数-线性标度对高收入人群进行分析,结果表明,与麦克斯韦-玻尔兹曼分布类似,指数分布能很好地拟合收入。

26
能者818 在职认证  发表于 2022-5-11 03:36:58
考虑的国家是美国、英国、德国和澳大利亚等发达国家。这些数据拟合得很好,他们使用洛伦兹曲线和基尼系数来说明这个不等式。结果表明,使用对数线性绘图的帕累托分布可以很好地拟合收入数据的上半部分。15 Kusmartsev和Kurten[42]的一项重要贡献是,他们利用基于封闭市场交易过程的数值模拟,表明货币分布通常按照Bose-Einstein分布进行。此外,在[43]中,Kusmartsev遵循同样的推理路线,基于统计力学方程构建了一个市场模型,并通过使用有关美国收入分配的数据,为Bose-Einstein分布的适用性提供了额外的证据。1.6数据描述了有关收入、支出、,我们将使用的财富是非累积的和累积的。在累积收入和概率的情况下,我们将使用人口的十分位数。收入或财富十分位数是根据收入或财富按升序对人口中的所有家庭或所有个人进行排序,然后将人口分成十个相等的群体,每个群体占估计人口的10%。第一个十分位数包含底部的10%,第二个十分位数包含下一个10%,第十个十分位数包含顶部的10%。未说明或未知的收入不包括在十分位数的计算中[61]。“十分位数”是指“将变量的分布划分为十个频率相等的组的变量值之一”[62]。简单地说,让我们假设一个国家的人口是100人。

27
可人4 在职认证  发表于 2022-5-11 03:37:01
我们根据他们的收入或拥有的财富,将他们越来越多地排在一个轴上。因此,第一个十分位数包含收入或财富最低的前十个人。第二个十分位数包含收入或财富排名高于第一组(第一个十分位数)的第二组10人。因此,人口可分为十个十分位或十组个人或家庭,每个十分位包含十个个人或家庭。收入十分位数的平均收入是个人或家庭在该十分位数中赚取的所有收入之和,然后除以该十分位数中包含的个人或家庭总数。收入上限是指从所有个人或十进位数中包含的家庭中获得最高收入的个人或家庭的收入。芬兰国家统计局[63]使用了该术语。16收入下限是指某个十分位数中所有个人或家庭收入最低的个人或家庭的收入。该术语由英国国家统计局使用[64]。在这些情况下,平均值的计算如下:所有国家数据(无论是关于收入、支出还是财富的事实)都按其值的递增顺序排列。所有这些数据被分成十等份,平均值(收入、支出或财富)被计算为十分位数中所有值的算术平均值。支出是根据收入的十分位数计算的。因此,在每个收入十分位数中,费用相加,然后除以某个收入十分位数中包含的个人或家庭总数。平均支出(以乌干达为例)是根据收入十分位数计算的。

28
可人4 在职认证  发表于 2022-5-11 03:37:04
因此,收入十分之一的人的支出总额除以人数。收入上限包括90%的人口,因为没有提供10%以上的数据。就平均收入而言,数据覆盖了整个人口,因为可以计算人口中最富有部分的平均收入。我们在图1.1中给出了芬兰1987年平均收入的典型例子。图1.1 1987年芬兰的平均收入。在y轴上,我们给出了10个十分位数的人口概率,其中每个十分位数代表人口的10%。在x轴上,我们表示可支配收入的十分之一。因此,第一个十分位数的平均收入为7880欧元,第二个十分位数的平均收入为10807欧元,第十个十分位数的平均收入为29012欧元。17图1.2 1987年芬兰的收入上限。在y轴上,我们给出了十分位数的人口概率,每个十分位数的频率为人口的10%。不幸的是,芬兰国家统计研究所没有提供关于十分之一的数据。在x轴上,我们表示收入的十分位数。因此,第一个十分位数的收入上限为9899欧元,第二个十分位数的收入上限为11607欧元,第九个十分位数的收入上限为23818欧元。我们可以注意到,十分位数的值高于平均收入的情况。费米-狄拉克和多项式概率密度函数也适用于不包含十分位数据的数据。根据任意选择的人口阈值,使用不同的人口百分比表示数据。如图1.3所示,年收入水平从15000美元以下到200000美元以上不等。

29
nandehutu2022 在职认证  发表于 2022-5-11 03:37:07
图1.3 1967年美国家庭年收入。18我们主要从国家统计机构或国家银行获得数据。在一些案例中,我们能够从一些发表的论文中获得数据。我们将使用来自巴西[65]、芬兰[63,66]、法国[67-71]、意大利[72-73]、菲律宾[74]、罗马尼亚[75]、新加坡[76]、英国[64]、乌干达[77]和美国[78]的数据。1.7理论框架我们打算使用本分章来描述我们将使用的理论概念,以及如何根据理论框架验证结果。我们将首先从统计测试开始,它描述了拟合函数对于我们上面描述的数据有多好。对于数据的统计验证,我们将使用相关系数、确定系数、t检验和Durbin-Watson检验。皮尔逊相关系数(r)或两组数据X和Y之间的相关性表明它们之间的关系有多强,定义为 (1.1)在图1.4中,我们可以看到不同r值的数据分布情况。图1.4根据不同值的差异[79]因此,r介于1和-1之间。r=0的值表示这两个变量之间没有关系。而对于r=-1和r=1,存在(完美的)强关系(第一种情况为负,第二种情况为正)[80]。19确定系数(R2)用于衡量两个变量的拟合优度。它实际上是相关系数(r)的平方。由于相关系数介于-1和1之间,因此确定系数介于0和1之间。R2=(归因于自变量的变化)/(因变量的总变化)。

30
能者818 在职认证  发表于 2022-5-11 03:37:11
如果R2=1,这意味着因变量的100%变化可以用自变量的变化来解释[80]。T检验可用于比较两组数据,以检验它们的显著性(如果它们具有不同的平均值)和回归函数参数的显著性。当我们使用它来评估两组数据的重要性时,我们使用以下公式[81]  (1.2)在哪里是两组值的平均值,s1和s2是两组数据的标准偏差,n1和n2是两组数据中的值数。标准偏差的计算方法如下 (1.3)比较两组数据时,t检验的值可根据根据自由度和所选置信区间计算的值表确定。如果结果高于表中的值,我们可以得出结论,这两组数据之间的关系是显著的。如果t检验的值低于表中所述的值,则关系不显著。。在回归的情况下,t检验统计量为t=(观察到的-预期的)/(标准误差)。该系数的预期值为0(假设为零假设为真,且零假设为β为0),通过将该系数除以该系数的标准误差得到检验统计量[82]。然后可以根据[80]as20计算T检验 其中b是一个坡度 根据方程式(1.3)计算s。Durbin-Watson检验研究回归后残差的自相关性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 16:22