楼主: kedemingshi
416 28

[量化金融] 评估可能的税收收入操纵的数据科学:案例 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
87.4399
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24756 点
帖子
4155
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Data science for assessing possible tax income manipulation: The case of
  Italy》
---
作者:
Marcel Ausloos, Roy Cerqueti, Tariq A. Mir
---
最新提交年份:
2017
---
英文摘要:
  This paper explores a real-world fundamental theme under a data science perspective. It specifically discusses whether fraud or manipulation can be observed in and from municipality income tax size distributions, through their aggregation from citizen fiscal reports. The study case pertains to official data obtained from the Italian Ministry of Economics and Finance over the period 2007-2011. All Italian (20) regions are considered. The considered data science approach concretizes in the adoption of the Benford first digit law as quantitative tool. Marked disparities are found, - for several regions, leading to unexpected \"conclusions\". The most eye browsing regions are not the expected ones according to classical imagination about Italy financial shadow matters.
---
中文摘要:
本文从数据科学的角度探讨了一个现实世界的基本主题。它特别讨论了是否可以通过公民财政报告的汇总,在市政所得税规模分配中或从市政所得税规模分配中观察到欺诈或操纵。研究案例涉及2007-2011年期间从意大利经济和财政部获得的官方数据。所有意大利(20)个地区都被考虑在内。经过深思熟虑的数据科学方法具体化为采用本福德第一位数定律作为定量工具。在几个地区发现了明显的差异,导致了意想不到的“结论”。根据对意大利金融阴影问题的经典想象,最引人注目的区域并不是预期的区域。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据科学 税收收入 Quantitative Data Science manipulation

沙发
kedemingshi 在职认证  发表于 2022-6-9 16:23:06 |只看作者 |坛友微信交流群
评估可能的税收收入操纵的数据科学:ItalyMarcel Ausloo1,2,*+, Roy Cerqueti3,,Tariq A.Mir4,§莱斯特大学管理学院会计与金融研究所,莱斯特大学路,莱斯特,LE1 7RH,UKGRAPES,rue de la Belle Jardiniere,B-4031 Liege,Federation Wallonie Bruxelles,BelgiumUniversity of Macerata,Department of Economics and Law,via Crescimbeni 20,I-62100,Macerata,ItalyNuclear Research Laboratory,印度查谟和克什米尔斯利那加Bhabha原子研究中心天体物理科学部2017年11月8日摘要本文从数据科学的角度探讨了一个现实世界的基本主题。它特别讨论了通过公民规模报告的汇总,是否可以在市政所得税规模分布中观察到欺诈或操纵。本研究案例涉及2007-2011年间从意大利经济和财政部获得的官方数据。所有意大利(20)个地区都被考虑在内。经过深思熟虑的数据科学方法具体化为采用Benford第一位数定律作为量化工具。在几个地区发现了明显的差异,导致了出乎意料的“结论”。根据意大利金融阴影问题的经典想象(classicalimagination),大多数眼球浏览区域并非预期区域。关键词:数据科学、本福德定律、所得税合计、数据操纵、意大利。JEL代码:H71、C82。*电子邮件:ma683@le.ac.uk,+电子邮件:marcel。ausloos@ulg.ac.be通讯作者。电子邮件:roy。cerqueti@unimc.it§电子邮件:taarik。mir@gmail.com1引言本文论述了识别税务公司是否存在异常的相关主题。我们特别关注意大利地区的情况。这一问题是在数据科学的视角下面临的,适合本研究的范围。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-6-9 16:23:09 |只看作者 |坛友微信交流群
事实上,数据科学如今是处理大型数据集的研究前沿的一个主要领域(参见Carbone et al.,2 016和其中包含的参考文献)。这项研究的相关性在于,有证据表明,评估财务报表中的错误是审计人员、监管人员或分析师的主要任务,不仅是在金融市场,而且在宏观经济和公共事务中,如政府经济数据中。会计报表数据报告对公共预算管理至关重要,甚至至关重要。因此,必须观察是否已经或正在发生错误估计、错误、偏差甚至操纵(Puyou,2014)。另一方面,学术研究人员必须提出检测错误或异常的方法。在创建和验证技术以评估不同的错误结构时,提出了许多方法和步骤(Cooper等人,2013)。然而,尽管在这一安全领域取得了实质性进展,但现有方法的有效性却受到了限制,有时是由于该方法背后的假设不明确。最有可能的是,这种情况将永远持续下去,因为众所周知,骗子的想象会导致进一步的网络钓鱼式操纵,而“决策者”的反应会受到法律程序的影响。是的,控制权受到聪明人的挑战,缺乏古典伦理。在对个别案件进行辩论之前,虽然没有对所有意大利公民提出指责,但通过GDP排名(http://inv estorplace.com/investorpolitics/10),人们通常承认意大利是逃税损失最大的国家之一(仅次于美国和巴西)- 最差的- 国家- 对于- ta x公司- 规避/#。V vkqf3AR54c),或通过影子经济造成的税收损失。

使用道具

板凳
mingdashike22 在职认证  发表于 2022-6-9 16:23:13 |只看作者 |坛友微信交流群
因此,可以在这样一个(国家)案例中对收入操纵进行合理的测试,例如Brosio et al.(2002)、Alexeev et al.(2004)、Calderoni(2011)或Mir et al.(2014)最近讨论的与伦理和有组织犯罪相关的主题。当然,不仅公民伪造了他们的财务数据,企业甚至政府也伪造了他们的财务数据(Aggarwal和Lucey,2007年;Michalski和Stoltz,2013年;Luippold等人,2015年)。例如,希腊向欧盟统计局提交的数据是否符合欧盟(EU)制定的严格定义标准,有人提出了疑问,请参见Rauch等人(2011),或中国的宏观经济数据(Holz 2013)。经理们可以采取比股东们更愿意采取的更多或更少的公司避税措施(Armstrong等人,2015年)。另一方面,企业有动机操纵收益以说服投资者,例如,当他们有收益(即4000万美元)时,报告一个四舍五入的上限值,当他们有损失时,报告一个数字,如3995万美元,正如Thomas(1989)所讨论的,他观察到了报告收益的这种常见模式。这种四舍五入的方法指向对数据的“适度操纵”。然而,它的相关性被认为是不常见的。0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046表1:一组数据中第一位数字(d)的频率(“频率”);d值范围从1到9,-根据BL1,等式(1)。对投资者来说微不足道。在citize ns的“较低水平”上,我们还知道,看似很小的舍入操作可能会影响财务报表用户对信贷质量的感知(Guan等人2008年)。

使用道具

报纸
nandehutu2022 在职认证  发表于 2022-6-9 16:23:15 |只看作者 |坛友微信交流群
在另一个层面上,当公民被淹没在人群中,并期望受到某个骗子的阴影的保护时,很有意思的是提出是否可以看到集体效应的疑问。这可以通过在地方层面上重新检查所得税缴款来实现。这一会计水平是我们调查和报告的核心。Bolton和Hand(2001、2002)对欺诈检测的统计方法进行了回顾,而Bierstaker等人最近讨论了会计师对欺诈检测和预防方法的看法。(2006); 另见Wadhwa和Pal(2012)的快速总结,或Lin et al.(2015)对几种技术的具体讨论。在此背景下,本文提出的数据科学方法是基于本福德定律的。本福尔d定律最初用于数据集的第一位数(BL1)分布,遵循对数定律:P(d)=对数(1+d),d=1,2,9,(1)其中P(d)是数据序列中第一个数字等于d的概率;Log是以10为底的对数。这一“定律”源于纽科姆(1881)和后来本福德(1938)的观察,即第一位数字的分布更集中于较小的值:数字“1”的频率最高,“9”的频率最低。在表1中,为了便于读者阅读,对BL1给出的第一个数字的频率进行了重新采集。此后,数学可以为第二、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、。。。数字分布。然而,由于后者变得更加统一,因此很难(但已经做到)使用如此高级别的数字来测试报告数据的准确性。因此,让我们将目标集中在第一位数字以下,即:。

使用道具

地板
能者818 在职认证  发表于 2022-6-9 16:23:19 |只看作者 |坛友微信交流群
BL1在特定案例中的有效性(或无效性),作为其他大数据调查的范例。总的来说,Benfor d法律必须得到重新推荐,因为它包含许多优点,如不受规模入侵的影响,并且在没有证明“交易”真实性的支持文件时,它也会被承认有帮助(Var ian 1972)。如今,这种所谓的“定律”为对性质相似的数字序列进行数字分析提供了方便的基础。例如,基于Benford法则的分析已被广泛用于识别员工盗窃和逃税的情况(Guan等人,2008),以及汇率偏离常规路径(Carrera 2015)或伦敦银行同业拆借利率(Abrantes Metz等人,2011)。事实上,根据Thomas(1989),可以使用Benford(1938)定律获得“操纵预期”,Nigrini(199419962012)后来指出了这一点。自Nigrini和Mittermaier(1997年)以来,人们承认BL1可以用来检测报告个人收入的会计数据中的欺诈行为。Hill(1998)、Pinkham(1961)、Raimi(1985)、Durtschi e t al.(2004)等,以及最近的Cleary和Thibodeau(2005)、Nigrini和Miller(2012)、Clippe和Ausloos(2012)、Pimbley(2014)、Amiram et al.(2015)、Mir(2016),都进一步强调了纽科姆-本福特法(1881-1938)在审计领域的有力方法,Auslo os等人(2016年)。事实上,BL1也适用于财务审计领域以外的领域;e、 g.关于图像取证,见Fu等人(2007年),关于出生率异常,见Ausloos等人(2015年),关于孕产妇死亡率,见Pollachet等人(2015年),或关于自然科学(Sambridge等人,2010年)和宗教活动(和平号,2012年)。

使用道具

7
mingdashike22 在职认证  发表于 2022-6-9 16:23:22 |只看作者 |坛友微信交流群
我们注意到文献数量巨大:参见Alali和Romero(2013),关于过去十年,Costa et al.(201 3),或Bee be(2016),其中包含了相当详尽的参考文献。仅限于公共政府金融领域的数据篡改,让我们提及,除其他外,在美国第五十个州的综合年度财务报告中,本佛定律对选定余额的应用(Haynes 2012;Johnson and Weggenmann 2013);或“数字政治经济学”国际宏观经济统计(Nye和Moul 2007)。一项对巴西两个州20家管理单位发布的134281份合同的数字分布进行分析的研究也发现,与本福德定律存在显著偏差(Costa et al.2012);另见Gava和Vitiello(2014)。Othman等人(2015年)对马来西亚公共事业中的欺诈检测(和预防方法)进行了讨论。在较低的范围内,如果必须回顾的话,我们的本福德定律允许发现地方政府报告的数据中的不足之处,如几个国家的市政当局和州,或例如美国或巴西。ValejoCity、Orange County和Jefferson County三个市的财务报表的数字分布与BL1(Haynes 2012)的预期有显著差异。在意大利,税收是地方政府的基本收入来源,能够高效提供服务(Padovani和Scorsone 2011)。另一方面,逃税现象在意大利很普遍(Brosioet al 2002,Fiorio a and D\'Amuri,2005,Marino a and Zizza 2011,Galbiati and Zanella 2012,Chiarini et al。

使用道具

8
nandehutu2022 在职认证  发表于 2022-6-9 16:23:25 |只看作者 |坛友微信交流群
2013).显然,任何因所得税流失而导致的市政财政困境都会对纳税人和市政雇员的生活产生严重影响(Bartolini和Santolini 201 2)。这对整个集团来说都很烦人,因此,从资金的需求(和使用)来看,对财务报表的质量和责任进行更好的监督似乎很重要,比如从意大利政府回来。此外,在最近的金融危机期间(Padovani和Scorsone,2011年),许多地方政府机构发生银行破产后,一方面对数据质量的担忧,另一方面对Ita中使用的公认糟糕的审计程序又重新浮出水面,事实上,更一般地说,公平地说,在几个工业化国家。在这篇与我们的研究相关的特定会计特征的回顾中,向读者指出一个最近的特定(偶然)意大利案例可能非常有趣,即Ciaponi和Mandanici(2015)提出的意大利大学应收账款和应付账款异常检测。这表明,金融数据销售的中间水平可能包含有趣的特征,因此进一步建议通过Benfor d定律的发展,提出关于操纵检测的问题,如这里的地区税收收入情况。因此,我们考虑了20个IT地区中每个地区的所得税报告的合计价值,即最近五年(2007-2011年)的数据可用。

使用道具

9
大多数88 在职认证  发表于 2022-6-9 16:23:28 |只看作者 |坛友微信交流群
正如Lusk和Halperin(2014)所建议的那样,我们用χ检验校准分析。我们的观点是政治经济上独特的:公民对IT GDP贡献的会计可靠性,尽管问题很多。有希望的是,在这个框架内,人们还可以(i)扩大BL1应用范围的知识,(ii)有助于更好地将BL1应用于会计,甚至(iii)表明可以得出社会经济政治结论。论文组织如下:第2节是关于方法论。第3 c节包含数据描述。发现了一种重新收集的昆虫。并在第5节中讨论。最后一节还允许我们为进一步的研究路线提供建议。附录中报告了在区域层面收集结果的所有表格。2方法学以下报告的研究从区域层面上对意大利城市所得税分配的价值(=规模)及其对国家GDP的贡献进行了深入分析。具体而言,给定地区的数据是通过对属于受检地区的市镇的市镇级数据求和获得的。我们指的是生活在每个意大利地区的所有公民的综合所得税(AIT,以下简称)。然而,如果存在,公民的收入操纵将发生在税收收入水平,这就是本文标题中具体而复杂的措辞。数值分析基于意大利经济和财政部(MEF)获得的官方数据,以及2007-2011五年期每年的数据。2011年,共有8092个市和20个地区,各具特色。注意,在o nc e中,这涉及大量的图形和表格。

使用道具

10
nandehutu2022 在职认证  发表于 2022-6-9 16:23:31 |只看作者 |坛友微信交流群
可以将它们连接起来,但这肯定意味着20个BL1图的显示,每个区域一个,每个区域有5组数据点,每年一个,如下所示。使用简单的自制算法检查第一位数字的位置。将每个数据点的实际发生率与预期金额进行比较。MS Exc el用于将数据组织成可用的形式。原始Alexcel数据文件按照城市名称的字母顺序列出了城市。这在Mir等人(2016)的研究中非常有用。本研究的目的是在中尺度,即区域水平上分析AIT数据。因此,我们首先将各个城市隔离开来,并将其放在各自的区域内。我们使用了“http://www.comuni-italiani.it/nomi/index.html“找出市政当局的管辖区域。Excel sprea数据表包括20列,以容纳20个地区中每个地区每年的数据,以及五年分析的六列加上五年的平均值。使用左侧(文本,数字-chars)通过在“text”处输入感兴趣的列号和在“num”处输入“1”(第一位数字)来实现excel的功能-字符”。通过指定单元格的“范围”和“标准”处的感兴趣数字,使用COUNTIF(范围,标准)函数获得每个数字(1到9)作为第一个数字的频率。由此确定每个数字的频率,即1到9,作为第一个重要数字。为了评估BL1的有效性,可以进行多项测试。mostclassicalχ检验用于其他BL1 a应用(Durtschi等人,2004)。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 17:19