楼主: kedemingshi
658 28

[量化金融] 评估可能的税收收入操纵的数据科学:案例 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-9 16:23:34
然而,在这一限制条件下,数据的可视化和报告的测试表允许我们确定点的规律性或异常:“可接受的一致性”,表明平衡可能没有偏差,应在不进行进一步分析的情况下接受“不符合”并不保证组成AIT的基础账户中存在问题歧视或欺诈行为,但BL1分析结果应作为需要进一步调查的指标。事实上,如果数据不符合BL1,这表明聚合数据可能不是真实的r表示;这些数字可能受到操作的影响,由于(我们,但我们做了很多交叉检查)错误而产生偏差,或者可能被操纵来欺骗某些财务报表用户。从遍历性的角度来看(Palmer 1982、Lucas和Sargent 1981;Davidson 198 7、1996、2009;Samuelson 1969;Tsallis et al.2003),通过时间平均值评估数据是有意义的;每个地区在相关的5年内都进行了这项工作。对这些平均值也进行了χ检验。3数据以下分析的经济数据由意大利MEF研究中心(和)获得。近五年(2007-2011年)意大利国内生产总值的贡献在市一级进行了分类(其中市或市被表示为comune,-pluralcomuni)。值得一提的是,意大利由20个地区和8000多个城市组成:后者的数量随着时间的推移而变化,甚至在经过审查的五年期间也是如此:2007年至2011年间,从8101个城市下降到809个城市:数个(10)城市合并为(3)个新实体,而(2)其他城市则被吞噬。此外,2008年,有7个城市从Marche a地区改为另一个地区(Emilia Romag na)。

12
何人来此 在职认证  发表于 2022-6-9 16:23:37
相关地区城市数量的变化已被考虑在内:我们对城市进行了虚拟合并(参见http://www.comuni- 意大利语。it/regioni。html),以便比较“稳定大小”区域的AIT数据。由于区域数量一直等于20个,因此区域一级似乎是任何数据衡量和讨论中最有趣的一个。表2中按重要性顺序列出了这些地区,即通过其城市数量列出。请注意,为2011年注册市政数字内容计算的预期χ是为了将来参考,避免在其他表格中出现额外的列或行。简言之,由此产生的城市的AIT(区域的AIT)是线性适应的,好像这些城市和区域内容在吞噬或吞噬之前就已经存在了。表3给出了连续几年的(四舍五入的)AIT以及五年内每个地区相应的平均AIT。AIT和<AIT>,因为它是(e+11)欧元,但区域是(e+10)欧元。作为补充信息,但ir与BL1测试相关,根据2011年人口普查,每个地区的居民人数(Ninhab)也从http://dati报告- Censimentopolazione。istat。it/索引。aspx?lang=e n.4结果除了连续几年的(四舍五入的)AIT以及五年期AIT和<AIT>上的区域平均AIT(以(e+10)欧元为单位)和(e+11)欧元为单位)以外,表3中给出了2007-2011年区域分布的统计特征以及相应的时间平均值。偏度和峭度明显都是正的,平均值比中值大(一个因子~ 1.75).

13
kedemingshi 在职认证  发表于 2022-6-9 16:23:40
相关地,可以观察到,最小和最大AIT都有1个as firtDigit。4.1 BL1显示每个(20)区域的所有BL1数据集显示在图上。1-20; 使用不同的符号来区分所检查的5年。在每幅图上,d数字的频率与理论BL1一起给定。此外,样本标准误差条,即取决于城市数量,即σ (1/p(Nc,r- 1) )允许以明显的符号绘制定义为[BL1-,BL1+]的定义区间的估计范围。已根据表2中给出的地区排名选择了显示顺序。将第一个数字表示为d,因此d=1,视觉观察(列出Nc,r的下倾顺序)起始日期:2007年(*)2009年2011年2011年北卡罗来纳州,伦巴第1546 1546↓ 1544 9 704 151 6.3694皮埃蒙特1206 4 363 916 5.2830威尼托581 4 857 210 7.7896坎帕尼亚551 5 766 810 17.224卡拉布里亚409 1 959 050 4.4664西西里390 5 002 904 6.4494拉齐奥378 5 502 886 5.0288萨尔德尼亚377 1 639 362 24.587埃米利亚-罗马尼亚341 341↑ 348 4 342 13 8.1620特伦蒂诺-阿迪奇阿尔托339↓ 333 333 1 029 475 5.3782阿布鲁佐305 1 307 30 4.7372托斯卡纳287 3 672 202 9.5140普利亚258 4 052 566 5.8868马尔凯246↓ 239 1 541 319 8.6922Liguria 235 1 570 694 16.895Friuli-Giulia Venez ia 219 218 1 218 985 7.8444Molise 136 313 660 12.657Basilica 131 578 036 7.5054Umbria 92 884 268 11.317ValledAosta 74 126 806 7.6682总计8101↓ 8094↓ 8092 59 433 744表2:2011年和前几年(20)个IT地区的Nc、rof城市数量;地区排名紧随城市数量的减少。有关IT城市的更完整信息,根据2011年人口普查,还报告了每个地区的居民人数(*)http://dati- censim Entopopopolazione。istat。it/索引。aspx?lang=英语。

14
大多数88 在职认证  发表于 2022-6-9 16:23:46
每个地区BL1平均观测值的经验χ可在最后一列中读取:它包含在本表中,以减轻其他表的负担。还记得,对于一些“自由度”,置信度为0.05的χ检验临界值为χ0.05=15.51 = 8,即BL1的值。。i Nc,rin AIT=2007年2008年2009年2011年5月305日ABRUZZO 1.2871 1.2850 1.3053 1.3288 1.3613 1.31352 131 BASILICATA 0.4580 0.4735 0.4820 0.4834 0.491 0.47763 409 CALABRIA 1。3404 1.3961 1.4411 1.4496 1.4516 1.41584 551坎帕尼亚4。1890 4.2908 4.3589 4.3833 4.3863 4.32175 348 EM.ROMAGNA 6.2211 6.3448 6.2945 6.3665 6.3970 6.32486 218 FRIULI V.G.1.6876 1.7121 1.7163 1。7214 1.7323 1.71 397 378拉齐奥7.1759 7.3436 7.4487 7.5532 7.6163 7.42758 235利古里亚2.2020 2.2402 2 2.2829 2.295 8 2.3003 2.26429 1544伦巴第14.457 14.7 37 14.561 14.771 15.008 14.70710 239马尔凯1.7710 1.8045 1.7977 1.8232 1.8567 1.810611 136莫里斯0.2736 0.2825 0.2827 0.2820 65 0.281512 1206皮埃蒙特5.9479 6.0326 5.9797 6.0515 6.1201 6.026413 258普利亚3.1445 3.2563 3.3082 3.35573.3947 3.291914 377萨尔德尼亚1.4896 1.5510 1.5789 1.5890 1.5977 1.561215 390西西里3.6977 3.8324 3.9066 3.9256 3.9451 3.861516 287托斯卡纳4.7404 4.8175 4.8417 4.89 43 4.9499 4.848717 333特伦蒂诺A.1.3967 1.4379 1.4808 1.5148 1.5360 1.473318 92翁布里亚1.0167 1.0432 1.0539 1.0624 1.0702 1.049319 74 V.D\'AOSTA 0.1795 0.1849 0.1889 0.1911 0.1923 0.187320 581 VENETO 6.2346 6.3244 6.29126.3808 6.4845 6.3431IT 8092 6.8910 7.0390 7.0601 7.1424 7.2178 7.0701表3:Nc,r,各地区的城市数量;(四舍五入)连续几年的AIT和五年内一个地区的平均AIT。AIT和<AIT>,因为它是(e+11)欧元,但对于(e+10)欧元的地区。2007年2008年2009年2010年2011年。

15
能者818 在职认证  发表于 2022-6-9 16:23:49
(/e+09)1.7950 1.849 5 1.8891 1.9110 1.9230 1.8735最大值(/e+10)14.457 14.737 14.561 14.771 15.0 08 14.707总和(/e+10)69.910 70.390 70.601 71.424 7 2.178 70.701平均值(/e+10)3.4455 3.5195 3.5300 3.5712 3。6089 3.5350地中海(/e+10)1.9865 2.0223 2.0403 2.0595 2.0785 2.0374RMS(/e+10)4。7793 4.8753 4.8601 4.9227 4.98 31 4.8840标准偏差(/e+10)3.39 82 3.4613 3.4274 3.4761 3.5254 3.4576标准误差(/e+09)7.5986 7.7397 7.6639 7.7729 7.8831 7.7314偏斜度1.7795 1.7784 1.7406 1.7478 1.7672 1.7627峰度3.4321 3.4359 3.2850 3.3097 3。3902 3.3708表4:2007-2011年IT地区(Nr=20)AIT(欧元)统计特征汇总(四舍五入)。o伦巴第:分布相当平稳,距离置信区间(CI)不太远;d=6,7与CI有一定距离;高于BL1+。o皮埃蒙特:分布比较平稳,离CI不太远;d=5,6稍微远离CI,特别是高于BL1+。o威尼托:在BL1的不同侧面,距离CI不太远的其他分布,即使d=4,5也稍微远离CI。d=9是最大值。o坎帕尼亚:非常分散,d=1,2除外;其他数字远离CI。o卡拉布里亚:分布比较平稳,离CI不太远;d=6,7稍微远离CI,高于BL1+;数字d=2低于BL1-.o西西里岛:d=1,BL1-以下4 b;d=7个分散的区域Laz io:分布相当平稳,距离CI不太远,即使d=4、5、6与CI有点距离(低于BL1-)萨尔德尼亚:非常非常分散,除了d=1,2。oEmilia Romagna:分布比较平稳,离CI不太远。d=3、4、5与CI有一定距离,且低于BL1-。数字d=8高于BL1+。oTrentino Alto Adige:分布较平滑,离CI不太远,但D=4,离CI稍远(BL1+以上)。

16
何人来此 在职认证  发表于 2022-6-9 16:23:53
d=7远高于BL1+,而d=6略低于BL1-。oAbruzzo:分布比较平稳,但远离CI;ondi BL1的不同侧面。o托斯卡纳:非常分散;d=BL1以下3、4、6、7-;d=8,9非常高于BL1+。o普利亚:非常分散;d=3、6、7远低于BL1-;数字d=2,9远高于BL1+。o马尔凯:非常分散;数字d=3、6远低于BL1-,而d=4、5、8、9远高于BL1+利古里亚:非常分散。数字d=3、6、8远低于BL1-,而d=2、4、6、9远高于BL1+。oFriuli Venezia Giulia:分布较平滑,但离CI较远;d=4、5、7远离CI,低于BL1-;d=2、3、8,远高于BL1+。o莫里斯·e:从BL1开始非常分散。数字d=1,2远低于BL1-,而d=3,6远高于BL1+。其他数字的宽幅变化。o巴西利卡塔:从BL1开始做了很多努力。数字d=4、8远低于BL1-,而d=5、6远高于BL1+。观察到所有数字的广泛变化翁布里亚:从BL1分散开来。数字d=4、6、7、8、9远低于BL1-,而d=1、2、5远高于BL1+。同样在这种情况下,所有数字的变化幅度都很大oValle d\'Aosta:从m BL1开始非常分散。d=4、8远低于BL1-,d=2、5、7远高于BL1+。一旦获得收益,所有数字的差异都很大。4.2χ符合性测试强调,每个地区有五个χ值需要计算,每年一个。表5-7给出了100个χ值。

17
mingdashike22 在职认证  发表于 2022-6-9 16:23:56
此外,AIT的时间平均值的结果χ也是合理的,-但回顾一下,表2中给出了它,以简化表5-7的读数。然而,在重新检查每个区域BL1之前,似乎应该检查χ本身的分布是否异常,-以便确定(如果发生)计算中产生的一些统计异常。100(20个地区,5年)χ的分布如图21所示。分布明显正偏斜,但相当不规则,有一组异常值。回想一下,当自由度为 = 8-BL1的值。这种相当高的峰值分布和一些异常值(特别是在不同年份发现的阿尔萨德尼亚和利古里亚)是在区域基础上进行BL1分析的另一个暗示。为了强调区域asp e CT,并结合表2最后一列,每个区域的平均值(五年平均值)<χ>分布如图22所示。有三个地区在较高范围内是明显的异常值:萨尔德尼亚、坎帕尼亚和利古里亚,大约<χ>≥ 15,指出了与BL1的许多(有疑问的)不符合项。相反,在五年期间,阿布鲁佐和卡拉布里亚两个地区的<χ>较低,表明与BL1非常一致(<χ>≤ 4).在这一阶段,根据显示的数据,似乎有必要指出χ值的时间不变性。此后,讨论每个区域的BL1值似乎很自然,以注意是否一致,从最有效的开始,以最异常的结束。这样,就可以根据标准风险值来区分值,以拒绝无效假设,即。

18
能者818 在职认证  发表于 2022-6-9 16:23:59
均匀分布,对于自由度,χ0.05=15.507 = 8.为了完整性,让我们观察一下(对于 = 8) 显著水平为0.10的χ的临界值为χ0.10=13.362.4.2.1<χ>≤ 从表2可以看出,BL1<χ>在17个地区有一个较小的值;从最低到最高依次为:拉布里亚(4.4664)、阿布鲁佐(4.7372)、拉齐奥(5.0288)、皮埃蒙特(5.2830)、阿迪奇(5.3782)、普利亚(5.8868)、伦巴第(6.369)和西西里亚(6.4494)、巴西利卡(7.5054)、奥斯塔谷(7.6682)、维尼托(7.7896)、弗留利威尼斯(7.84 44)、埃米利亚·罗马格纳(8.1620)、马尔凯(8.6922)、托斯卡纳(7.6682)。9.5140)、翁布里亚(11.317)和莫里斯(12.657)。其中,表5-7显示,除了一些例外情况外,各年值都有很大的规律性。2007年的Veneto(11.33)、2010年的Emilia Romagna(10.6 0)和2010年的Valle d\'Aosta(11.31)的值使得各自的χ超出了5%的采样误差范围。Molise的最大χ值出现在2008年,~ 20.99,尽管χ值非常小~ 9.74发生在2007年。暗带的χ值很高,但没有任何严重的异常迹象;对于翁布里亚来说,χ值的分布确实很窄,这意味着某种系统性。4.2.2 < χ>≥ 15.507,以及每年(ir)的规律性在contra st、利古里亚(16.895)、坎帕尼亚(17.224)和萨尔德尼亚(24.587)是三个表明与BL1非常不一致的地区。2007年和2011年Sardegna oc cur的两个最大χ值:~ 分别为56.0和21.36。C ampania的最大χ值出现在2007年和2008年:~ 分别为21.6.5和23.02。

19
nandehutu2022 在职认证  发表于 2022-6-9 16:24:02
2008年利古里亚病的最大χ值:~ 27.17; 令人惊讶的是,χ值非常小~ 9.70发生在2011.5讨论中。本节对调查结果进行了总结和讨论。总的来说,意大利地区的AIT与BL1的理论陈述之间的一致性是相当值得怀疑的。在地区层面上存在差异,这符合意大利地区在社会经济角度下的异质性。特别是,人们可以注意到,这些地区的地理和经济特征之间有着非常好的匹配,其中包括N(北部)、C(中部)、S(南部,加上西西里岛和萨尔德加)。N是意大利的一部分,由8个区域组成:Emilia Romagna、FriuliVenezia Giulia、Liguria、Lombardia、Piemonte、Trentino Alto Adige、Valle d\'aosta和Veneto;C包括5个地区:阿布鲁佐、拉齐奥、马奇、斯堪纳和翁布里亚;S是剩下的7个地区:Basilicata、Calabria、Campania、Molise、Puglia、Sardegna、Sicilia。与BL1的偏差通常被理解为“数据操纵”。然而,这部法律在会计界无疑是一个有争议的话题。即使现在也不清楚为什么它在任何“社会经济条件”下都是有效的,也不清楚它在各种假设下的理论推导是否告诉我们它的起源及其应用范围。就连纽科姆和本福德也对有效性领域表示怀疑。因此,需要深入探讨AIT数据背后的区域现实、如何收集这些数据以及区域层面的影子经济,以对结果进行严格的解释。这远远超出了本文的范围。

20
可人4 在职认证  发表于 2022-6-9 16:24:05
我们只能给出一些建议和讨论,以作为未来研究的论据。在BL1χ异常的3个区域中,有两个属于S:Rdegna和Campania,另一个来自N:Liguria。萨尔德尼亚的特点是,在几个居民非常少的城市中,城市一级存在明显的分裂。该地区的产业结构并不发达,大部分地区经济仍以农业和畜牧业为基础。在小社区中,经济有些封闭,商业交流通常以商品为基础。在这种情况下,人们可以猜测,官方数据和所得税之间的差异应该来自真实的地区经济。可悲的是,坎帕尼亚有组织犯罪对经济体系产生巨大影响的相关证据。因此,与BL1的偏差可视为“预期”。利古里亚的经济体系似乎受到阴影经济渗透的影响。意大利艺术家和小企业协会(Confartigianato)表示,约73%的工匠与加兰岛影子经济体竞争(见http://www.confartigianatoliguria.it/node/4153)。这一证据为解释为什么利古里亚与BL1存在这种差异提供了很好的线索。毫无疑问,我们承认,其余地区符合BL1,在五年期内存在一些差异,如前一节所述。从经济和社会角度来看,一些地区与坎帕尼亚非常相似,存在着显著的有组织犯罪(想想卡拉布里亚、普利亚和西西里岛,也想想北部的维尼托和伦巴第)。巴西利卡塔和莫里斯与萨尔德尼亚的相似之处在于缺乏完善的产业结构。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 08:50