楼主: nandehutu2022
2807 36

[经济学] 拓扑数据分析和联合国儿童基金会多指标类集调查 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-4-26 16:08:23
这意味着使用DBSCAN和欧几里德度量进行聚类时,每个间隔只产生一个聚类。请注意,这并不意味着每个间隔中的每个household都放在一个集群中。我们可以从节点(2,0)和(3,0)之间缺乏边缘看出,区间2和区间3相交处的住户不在两个相应的集群中。我们还可以从间隔1中缺少节点的情况看出,在该间隔中没有找到集群。事实上,每个区间只有一个节点,这意味着聚类会引导我们在基于概率的半度量的图中看到的许多有趣的属性,例如theTDA和MICS 13图7。节点内财富分数的分布(5,0)。节点平均wscore wscoreσwscore min wscore max Percent rural#户(0,0)-5.747 0.937 -7.679-4.145 0.652 23(1,0) -4.613 0.866 -7.441-2.578 0.653 49(2,0) -3.467 0.642 -4.795-2.087 0.574 54(2,1) -4.002 0.588 -4.83-2.983 0.929 14(3,0) -1.834 0.673 -3.29-0.732 0.553 38(3,1) -3.309 0.344 -3.984-2.873 1.0 9(4,0) -0.842 0.665 -3.259 0.249 0.387 367(4,1) -0.836 0.43 -1.481-0.194 0.333 9(4,2) -1.718 0.572 -3.08-0.689 0.933 15(5,0) -0.405 0.573 -2.68 0.624 0.432 1053(5,1) 0.401 0.299 -0.348 0.586 0.0 9(5,3) 0.105 0.388 -0.513 0.579 0.125 16(5,2) 0.126 0.368 -0.576 0.53 0.067 15(5,4) -0.075 0.372 -0.778 0.301 0.333 9(6,0) 0.2 0.451 -1.582 0.927 0.336 1977(7,0) 0.535 0.348 -0.988 1.141 0.349 2540(8,0) 0.696 0.267 -0.207 1.236 0.468 920(9,0)0.842 0.241 0.179 1.402 0.709 1038图8。每个节点的关键统计信息。这里wscore表示财富分数,σ表示标准差。循环并翻转图表的主干。这些特征的缺失使得欧几里德曲线在洞察财产和生活标准之间的关系方面非常有用。

22
nandehutu2022 在职认证  发表于 2022-4-26 16:08:29
事实上,我们考虑使用基于欧几里德度量的图的原因之一是对JUN RU ANDERSON、FAHRUDIN MEMI’C和ISMAR VOLI’C图9进行插图说明。使用欧几里得度量生成的塞尔维亚2014-15年MICS数据的映射图。每个节点的颜色都基于组成家庭的平均财富分数。颜色越深,财富分数越低。分量之间的距离和图形的形状与基于概率的半度量的对比无关,并为使用这种更有趣的距离函数提供了验证。另一个需要注意的关键特性是,虽然图6中的图形是连接的,但图9中的图形不是连接的。5.讨论。1.将信息叠加到地图上。在本节中,我们将考虑MICS调查中的其他信息,并通过相应的节点着色,将其覆盖在图6中的Mapper图上。这将有助于了解财富分数与城市或农村地区生活之间的关系,以及财富分数与某些类型物品所有权之间的关系。5.1.1. 财富分数和城市/农村生活。图10显示了三个图,其中基础图形与图6中的映射器相同,但现在节点根据特定问题的答案着色。在图(A)中,节点的颜色基于MICS研究中被归类为农村的家庭百分比。深紫色表示城市住户比例较低,而浅黄色表示城市住户比例较高。图(B)和(C)中的节点是基于土地所有权和拖拉机所有权而着色的,这两项与农村农业密切相关。

23
何人来此 在职认证  发表于 2022-4-26 16:08:35
较深的紫色表示拥有该物品的住户比例较低,而较浅的黄色表示拥有该物品的住户比例较高。生活在农村地区的人平均来说不如生活在城市地区的人富裕,这是很常见的。图10在很大程度上证实了这一观点。我们看到,最低财富节点(参考图6中的颜色)是农村家庭图(图10(A))中最亮的节点之一,并且随着我们向图中较高财富端移动,节点逐渐变暗。TDA和MICS 15(a)农村家庭(b)土地所有权(c)拖拉机所有权图10。说明财富和农村生活方式之间关系的图表。这反映在土地所有权的数据中。虽然有人可能会认为拥有土地是富裕的标志,但拥有土地的家庭远不如不拥有土地的家庭富裕。(如果我们检验这个假设,我们得到的p值<2.2×10。)-16.拥有土地的家庭和非拥有土地的家庭之间财富得分差异的95%置信区间为(-0.44, -0.38).) 然而,如果生活在农村地区能够调节土地所有权和财富之间的关系,这可以解释(换句话说,如果拥有土地与生活在农村地区相关,而生活在农村地区与财富较低相关,这将解释拥有土地与财富较低相关这一最初并不直观的事实)。然而,有一个值得注意的例外:右边的最后一个节点的平均财富得分最高,与左边的几个节点相比,它的农村家庭(按比例)更多。这些家庭也更有可能拥有土地。一种可能性是,虽然城市居民平均来说更富有,但事实上,最富有的个人从事农业。

24
何人来此 在职认证  发表于 2022-4-26 16:08:41
最后一个节点中拖拉机所有权的激增支持这种解释,因为拖拉机是一种农业工具。另一种可能的解释是,人们一旦变得富有,就会选择离开城市,搬到农村地区。然而,这并不能完全解释为什么即使是最富有的城市居民也报告拥有可用于农业的土地,也不能解释为什么许多人拥有拖拉机。5.1.2. 财富分数和物品所有权。接下来,我们通过将图6中的图表涂上拥有特定物品的家庭百分比,来研究特定财产与总体财富分数之间的关系。图11显示了九个图表,分为三类。和以前一样,深紫色阴影对应的是报告拥有相关物品的家庭比例较低,而浅黄色阴影对应的比例较高。这些图表显示了三种主要的财产类别。有一些“基本”财产,除了最贫穷的家庭外,几乎所有家庭都拥有100%的所有权。还有一些“奢侈品”,其特点是除了最富有的家庭外,所有人都拥有近0%的所有权,而这些家庭的拥有率相对较低。还有“中产阶级的便利设施”,其特点是16年6月的低利率,如安德森、法赫鲁丁·梅米和伊斯马尔·沃利(a)电(b)床(C)带椅子的桌子(d)汽车(e)手机(f)电脑-→(g) 洗碗机(h)摩托车(i)烘干机如图11所示。各种财产的映射图。箭-→ 表示从被认为更重要的项目到被认为更奢侈的项目的进展。最贫困家庭的所有权,以及Node(5,0)或(6,0)附近的高所有权率。请注意,这种对必需品和奢侈品的分类并不等同于简单地说租赁物品是奢侈品。

25
nandehutu2022 在职认证  发表于 2022-4-26 16:08:47
例如,动物拉的手推车是唯一拥有最少的物品,但这不是奢侈品。该项目的所有权在各个节点上始终较低,平均财富分数也各不相同。这种分类方法可以应用于所有关于财产的MIC问题,也可能适用于某些物品的非直观分类。例如,图12显示了另外两种颜色,这一次是按电视所有权和微波所有权。(a) 电视拥有量图(b)微波炉拥有量图12。电视和微波炉所有权的映射图电视所有权的图与“基本”物品的图最为相似,尽管民众可能不会将其归类为“基本”物品(例如,购买电视的ZF援助对象可能会被批评为不负责任)。另一方面,forTDA和MICS的所有权曲线图与“奢侈品”最为相似,尽管许多富裕国家的人认为这很重要。人们不明智地花钱的解释很难成立,因为微波炉比电视便宜。换句话说,能够购买亚视的人或家庭也能够购买微波炉,因此人们倾向于选择电视而不是微波炉这一事实表明,电视比微波炉对幸福感有更大的积极影响。这也提醒我们,文化规范并非普遍适用;虽然美国人可能会认为微波炉是烹饪的基本工具,但在另一个国家,由于食物制备方式的不同,这种设备可能不那么理想。5.1.3. 财富分数和家庭类型。节点(0,0)和(1,0)是最贫穷的家庭。在这些节点中,基本物品的所有权并不普遍。

26
大多数88 在职认证  发表于 2022-4-26 16:08:53
尽管这些家庭中有三分之二属于农村家庭,但许多家庭没有自己的房子,很少有人拥有土地。节点(2,1)和(3,1)举例说明了“农村穷人”的类别这些家庭都拥有土地,大多数(节点(2,1)中的85.7%和节点(3,1)中的100%)也拥有动物。他们大多拥有基本设施,但很少有中产阶级的便利设施。中产阶级和上层阶级家庭可以根据项目类型进行分类。换句话说,节点(7,0)是大多数家庭中第一个出现空调和微波炉等奢侈品的节点,因此我们可以将节点(7,0)、(8,0)和(9,0)视为上层家庭。类似地,节点(4,0)是大多数家庭开始出现中产阶级设施的地方,因此我们可以将节点(4,0)、(5,0)和(6,0)划分为中产阶级家庭。应该指出的是,诸如“中产阶级”、“上层阶级”或“穷人”这样的称呼是不精确的,甚至与家庭状况的完整信息相重叠。事实上,(3,1)和(4,0)以及(6,0)和(7,0)有一些重叠,因为它们之间有一条边。5.2. 概率映射器的图论性质。在本节中,我们将分析图6中映射器的一些图论属性,例如有趣路径和曲面的存在。5.2.1. 路径。项目分类如图6所示。这可以通过检查项目所有权在我们前进的过程中如何变化来看出。图13显示了从节点(0,0)到节点(9,0)的顶部路径上每个节点中拥有三种不同物品/设施的住户比例:电(基本)、洗碗机(豪华)和汽车(介于两者之间)。

27
mingdashike22 在职认证  发表于 2022-4-26 16:08:59
这提供了映射器中信息的不同图形表示。这里的“路径”一词有一个简单的图论意义——它是连接一个节点到另一个节点的一系列边——不应该被理解为经济流动的路径。虽然有人认为这些物品中的一些会产生财富(拥有一辆汽车可能会让通勤者找到一份收入更高的工作),但在大多数情况下,这些物品更有可能是财富的反映(拥有一辆汽车需要一定数量的财富,但这并不会让车主变得更富有)。图13中的分析的优点在于提供了相对优先级的更精确图像。这张图表显示,直到电力拥有率接近100%时,汽车的拥有才会出现。另一方面,虽然洗碗机的拥有量在之后上升,幅度稍小,但在汽车拥有量达到100%之前,我们开始看到洗碗机的拥有量。从这一点,我们可以推断,人们更喜欢电,而不是汽车,而不是洗碗机,但后者的偏好并没有那么强烈或一致。6月18日RU ANDERSON、FAHRUDIN MEMI\'C和ISMAR VOLI\'C图13。从节点(0,0)到节点(9,0)以及节点(2,0)和(3,0)的路径中不同节点的项目所有权图。分析穿过节点(2,0)和(3,0)的路径差异,以及穿过节点(2,1)和(3,1)的路径差异,也突显了城市/农村的财富差异。我们看到,手机和电视的所有权沿着前一条道路快速上升;即使从图11中的映射图也可以看出这一点。床和电力所有权的差异远没有那么明显,也无法从地图的颜色中立即辨别出来。这表明,虽然城市/农村的财富差异存在,但在这些家庭中,它体现在比生活关键项目更不重要的项目上。5.2.2.

28
何人来此 在职认证  发表于 2022-4-26 16:09:05
照明弹。我们不会精确地定义“fl are”(可以根据节点度和度来定义)的含义,因为这从图6中的图表中可以清楚地看出:节点(4,1)和(4,2)fl来自节点(5,0),节点(5,1)、(5,2)、(5,3)和(5,4)fl来自节点(6,0)。应该注意的是,这些区域包含的住户很少——节点(5,3)最多,16个,节点(4,1)、(5,1)和(5,4)最少,每个节点9个。回想一下,节点是通过在过滤函数图像的每个间隔内聚集住户生成的。由于这些差异相对于构成图表主干的节点中的家庭数量而言非常小,我们可以将其视为家庭成员,这在回答类似数量问题的人中并不常见。节点(4,2)看起来非常农村化,土地所有权和动物所有权的比例为100%。起初,它看起来可能属于农村贫困人口。平均财富分数为-1.718,相比之下-节点(4,0)和-节点(4,1)为0.837,在同一时间段内,农村家庭的富裕程度继续低于城市家庭。然而,节点(4,2)中的平均财富分数比节点(3,1)中的平均财富核心高出约1.5个标准差;财富分数-3.309处于财富分数分布的尾部,TDA和MICS 19,而财富分数为-1.718在边境上。与节点(2,1)和(3,1)中的住户不同,节点(4,2)中的住户拥有大量便利设施(如电炉、熨斗、收音机、吸尘器和洗衣机),而这些设施在节点(2,1)和(3,1)中不太常见。此外,节点(4,2)中的九个家庭中有五个拥有银行账户,而innodes(2,1)或(3,1)中没有一个家庭拥有银行账户。

29
mingdashike22 在职认证  发表于 2022-4-26 16:09:13
因此,节点(4,2)中的家庭(当然很少)可以作为农村生活水平的目标。另一方面,节点(4,1)拥有0%的土地和动物所有权,平均财富分数与节点(4,0)相似。相反,将节点(4,1)与(4,0)和(4,2)区分开来的是100%的自行车拥有率(相比之下,节点(4,0)、节点(4,2)和节点(5,0)的自行车拥有率分别为12.8%、0%和33.7%)、100%的手表拥有率(相比之下,节点(4,0)、节点(4,2)和节点(5,0)的自行车拥有率分别为37.6%、更高的手机拥有率、更低的非手机拥有率和更低的冰箱拥有率)。我们还看到有线电视拥有率约为节点(4,0)的一半,节点(5,0)的三分之一。从广义上讲,这看起来像是将个人每天出门时携带的物品优先于留在家中的便利设施。这反过来可能意味着一群人会优先考虑保持外表。然而,由于样本量小,很难做到精确。然而,我们可以推断,Interval 4中的绝大多数家庭聚集在节点(4,0)中,而不是节点(4,1),因此大多数人对购买的偏好确实优先考虑家庭设施。对于理解如何最有效地提高生活水平而言,这是一个有用的信息——它表明,对于大多数人来说,家庭设施比随身携带的小玩意更重要。节点(5,1)-(5,4)的平均财富得分均高于节点(5,0),且农村地区的平均财富得分也远低于节点(5,0)。所有人都展示了100%的笔记本电脑/电脑所有权,而node(5,0)和node(6,0)分别为18.8%和73.8%。

30
可人4 在职认证  发表于 2022-4-26 16:09:19
节点(5,1)、(5,2)和(5,3)的电视拥有率也比节点(5,0)高得多。节点(5,1)的特点是平均财富分数高于节点(5,0)、(5,2)、(5,3)、(5,4)和(6,0)。我们看到九户人家没有收音机或自行车,只有一块手表,但却拥有诸如空调、奢侈品、有线电视和互联网等各种设备。与节点(4,1)一样,节点(5,1)中的家庭数量较少,因此很难进行推断。然而,我们可以说,这些住户与innode(5,0)中的其他住户分开聚集的事实证实了这些设施的奢华地位,因为这表明,区间5中拥有这些设施的住户与该区间的主要集群“相距甚远”。6.结论在最一般的层面上,我们已经证明了TDA可以用于研究布尔数据的形状。在欧几里德空间中,长度为34的两个布尔向量之间的距离只能取35个不同的值,这在试图研究形状时带来了挑战。通过应用基于概率的半度量,我们允许两点之间的距离具有更广泛的值排列,同时保留距离的含义;这为执行聚类和TDA分析打开了大门。我们进一步证明,在同一映射器图上使用不同的叠加颜色可以阐明不同变量之间的关系。由于映射器执行从局部到全局的信息提取,因此使用不同的叠加颜色查看同一个图形可以让我们清楚地看到总体趋势和与总体趋势的偏差,而不会受到噪声的影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 19:20