楼主: 能者818
946 24

[量化金融] 利用对抗性方法检测潜在空间中的会计异常 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.5040
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-6-24 13:16:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Detection of Accounting Anomalies in the Latent Space using Adversarial
  Autoencoder Neural Networks》
---
作者:
Marco Schreyer, Timur Sattarov, Christian Schulze, Bernd Reimer, and
  Damian Borth
---
最新提交年份:
2019
---
英文摘要:
  The detection of fraud in accounting data is a long-standing challenge in financial statement audits. Nowadays, the majority of applied techniques refer to handcrafted rules derived from known fraud scenarios. While fairly successful, these rules exhibit the drawback that they often fail to generalize beyond known fraud scenarios and fraudsters gradually find ways to circumvent them. In contrast, more advanced approaches inspired by the recent success of deep learning often lack seamless interpretability of the detected results. To overcome this challenge, we propose the application of adversarial autoencoder networks. We demonstrate that such artificial neural networks are capable of learning a semantic meaningful representation of real-world journal entries. The learned representation provides a holistic view on a given set of journal entries and significantly improves the interpretability of detected accounting anomalies. We show that such a representation combined with the networks reconstruction error can be utilized as an unsupervised and highly adaptive anomaly assessment. Experiments on two datasets and initial feedback received by forensic accountants underpinned the effectiveness of the approach.
---
中文摘要:
会计数据欺诈的检测是财务报表审计中的一个长期挑战。如今,大多数应用的技术都是指从已知欺诈场景中衍生出来的手工规则。这些规则虽然相当成功,但也存在一个缺点,即它们往往无法推广到已知的欺诈场景之外,欺诈者逐渐找到规避这些规则的方法。相比之下,受最近深度学习成功启发的更先进方法往往缺乏对检测结果的无缝解释。为了克服这一挑战,我们提出了对抗式自动编码器网络的应用。我们证明了这种人工神经网络能够学习真实世界日记条目的语义有意义表示。所学的表示法提供了一组给定日记账分录的整体视图,并显著提高了检测到的会计异常的可解释性。我们表明,这种表示结合网络重构误差可以作为一种无监督的、高度自适应的异常评估。在两个数据集上的实验和法务会计师收到的初步反馈支持了该方法的有效性。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Detection_of_Accounting_Anomalies_in_the_Latent_Space_using_Adversarial_Autoenco.pdf (5.41 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Presentation Applications Quantitative Econophysics Construction

沙发
kedemingshi 在职认证  发表于 2022-6-24 13:16:11
使用DVersarial自动编码器神经网络检测潜在空间中的会计异常。加伦,瑞士马科。schreyer@unisg.chTimur德国联邦银行法兰克福分行。sattarov@bundesbank.deChristian圣加伦斯特SchulzeUniversity of St.GallenSt。加伦,瑞士基督教。schulze@unisg.chBernd雷默斯图加特,德国雷默尔。bernd@pwc.comDamian圣加伦斯特博思大学。瑞士加伦。borth@unisg.chABSTRACTThe会计数据欺诈的检测是财务报表审计。如今,大多数应用的技术都是指从knownfraud场景派生的手工规则。虽然这些规则相当成功,但它们往往无法概括已知欺诈结果以外的情况。为了克服这一挑战,我们提出了对抗式自动编码器网络的应用。我们证明了sucharticial神经网络能够学习真实世界日记账分录的语义有意义表示。learnedrepresentation为给定的一组日志和签名提供了一个整体视图可显著提高已检测会计异常的可解释性。我们表明,这种表示结合网络重构误差可以作为一种无监督的、高度自适应的异常评估。在两个数据集上的实验和取证人员收到的初始反馈支持了e方法的客观性。CCS概念o计算方法→ 异常检测;降维与流形学习;对抗性学习。关键词检测,法医数据分析,计算机辅助审计ACM参考格式:Borth。2019年。使用DVersarial自动编码器神经网络检测潜在空间中的会计异常。在里面

藤椅
nandehutu2022 在职认证  发表于 2022-6-24 13:16:14
ACM,美国纽约州纽约市,11页。允许制作本作品的全部或部分数字或硬拷贝供个人或教室使用,无需支付费用,前提是不制作或分发副本。从请求权限permissions@acm.org.KDD-ADF\'1192019年8月5日,阿拉斯加州安克雷奇(c)2019计算机械协会。公司条目ID会计年度类型日期货币参考文本交易AAA 100011 2017 SA 31.10.2016 USD 000349年度。。。SA01AAA 100012 2017 MZ 31.10.2016美元-材料。。。2017年2月1日,MM23BBB 900124,金额148292美元发票。。。IN04…传入发票$1000传出付款$1000支出负债银行CCD D$1000$1000$1000 ProcessAccountingAIS数据日记账分录标题表日记账分录段表渠道记录公司分录ID子ID货币金额D/C分类账供应商客户AA 100011 0001美元1000.00 D 1000129-AA100110002美元1000.00C 4010111 5890-BBB900124001美元232.00D 1022001-82304... ... ... ... ... ... … … …图1:会计信息系统(AIS)的层次视图,它记录了不同的抽象层,即(1)业务流程,(2)会计和(3)指定表中的技术日记账分录信息。1 2018年职业欺诈和滥用简介研究“[]该组织指“通过故意滥用组织的资源或资产,滥用职业谋取个人财富”[]。普华永道审计师进行的一项类似研究显示,约30%的受访者因欺诈而蒙受了10万美元至500万美元的损失[]。

板凳
何人来此 在职认证  发表于 2022-6-24 13:16:17
研究还表明财务报表欺诈是受调查欺诈计划中损失中位数最高的一种。与此同时,各组织加快了业务流程的数字化[]a尤其是会计信息(ERP)系统。这些系统稳定地收集了大量的,尤其是一个组织在总账和明细账账户中记录的日记账分录。SAP是最主要的企业软件提供商之一,据估计,普华永道的研究涵盖了过去24个月内经历过经济犯罪的7228名受访者。arXiv:1908.00734v1【cs.LG】2019年8月2日KDD-ADF’2019年8月5日,阿拉斯加州施雷耶安克雷奇arov等人,全球77%的交易收入涉及他们的ERP系统之一[]。图1描述了AIS在指定数据库表中记录日记账分录信息的过程的层次视图。为了进行欺诈,犯罪者需要偏离常规的系统使用或发布模式。此类偏差区域及其各自的属性值。检测潜在的欺诈Compass基于规则的分析,称为“红色-ag“测试(如深夜过账、多个供应商银行账户变更)以及统计分析(如Benford定律、时间序列评估)一亿日记账分录仍然是一项劳动密集型任务,需要铁路超高时间eort和资源。受arti最新技术进步的推动社交智能[]基于深层神经网络的技术(例如,为了降低另一方的“采样风险”[]而采用的深层辅助日志条目),必须在法庭上进行辩护[17]。这种对抗性架构能够学习sejournal条目。

报纸
kedemingshi 在职认证  发表于 2022-6-24 13:16:21
总之,我们提出了以下贡献:o将条目划分为语义有意义的组;o以可解释的方式进行审计的日记账分录;o条目重建误差的大小可以是条目间误差。t作为审计师和法务会计师工具箱2的补充,我们概述了相关工作。第3节描述了对抗式自动编码器网络架构,并提出了检测会计异常的拟议方法。第4节和第5节概述了实验装置和结果。在第6节中,本文总结了当前的工作和未来的研究方向。建议方法的实施可用athttps://github.com/GitiHubi/deepAD.2相关工作下文介绍的文献综述侧重于(1)检测神经网络(AEN)[]以及生成性对抗网络(GANs)[29]。2.1会计数据中的欺诈检测从业者[]和学术界[]都研究了检测欺诈和会计异常的任务。一些参考文献描述了di不同的欺诈方案和发现不寻常的“创造性”会计做法的方法【45】。企业资源规划(ERP)系统和增量。McGlohon等人应用链接分析来识别高风险总账账户的(子)组[]。Kahn等人在[]和[]创建事务处理专业SAP ERP用户的les。专业人士les源自两个SAP R/3 ERP系统中记录的基于日记账分录的用户活动模式,用于检测可疑用户行为和违反职责划分的行为。同样,伊斯兰教等。

地板
何人来此 在职认证  发表于 2022-6-24 13:16:25
在[]中,使用SAP R/3系统审核日志通过“红色”来检测已知欺诈事件和共谋欺诈-基于ag“的Y匹配搜索是否违反Benford定律[]、异常的数字组合以及异常的时间模式,如endclass聚类,以对SAP ERP采购订单交易进行单变量和多变量聚类。交易意味着cantlyare建议审计师进行详细审查。该方法在[]中得到了增强,通过过程挖掘检测偏差日记账分录的欧氏距离和从极值理论得出的日记账分录属性的估计最佳抽样阈值的代码向量[5]。ENCE要么从会计和法医学知识中获取有关历史欺诈计划的信息,要么从非深度学习的技术中进行检测金融欺诈。然而,由于深度学习技术最近取得了成功,欺诈者可能会滥用这些技术,因此我们看到,对审计师的需求也很高,要求他们同样加强他们的审计方法。使用对抗式自动编码器神经网络检测潜在空间中的会计异常KDD-ADF’19,2019年8月5日,阿拉斯加州安克雷奇。。。。编码器-发电机网络解码器网络。。。。。。。。。。功能1x1x2x3x4x5xn功能2。。。特征k§类型§日期§贸易§GL账户§机构§金额§对应方§T-代码§类型§日期§贸易§GL账户§机构§金额§对应方§T-代码。。。。。。。。。。。。。。。鉴别器网络“真实”先验分布“假”先验分布正确重建正确重建InputJournal条目重建的Journal条目X1X2X3X4X5XN。。。功能1功能2功能kAutoencoder(AEN)对抗式自动编码器(AAE)图2:对抗式自动编码器架构【31】,用于了解日记账分录特征并将分录划分为语义有意义的组。

7
可人4 在职认证  发表于 2022-6-24 13:16:28
对抗式自动编码器网络架构在离散的潜在代码向量z上施加任意的先验分布p(z),例如高斯混合。通过渐进式训练,编码器学习者在欺骗鉴别器网络dД之前,聚合后验分布Дθ(z | x),该后验分布与施加的d相匹配。2.2使用深度学习进行异常检测,以检测财务数据【10,37】。在信用卡交易中。类似地,Kazemi和Zarrabi[]以及Sweers等人[]训练和评估了各种变分体系结构。Pumsirrat和Yan在[]中基于历史信用卡交易的三组信用特征数据集,比较了AENs的异常检测性能。Paula等人在[]中通过分析出口货物数量进行欺诈。同样,Schreyerdata。tion公司。Fiore等人在[]中训练此类网络以生成模拟噪声,用于增加训练数据以改进另一项研究中,Zheng等人在[]中提出了生成性去噪金融机构。数据3日常日常业务活动的方法。以进行欺诈,并将其各自的属性值。我们参考日记账分录来显示会计异常等偏离属性值。3.1会计异常类别当对真实世界的日记账结束属性值进行详细检查时,例如,由于供应商数量较多,或通常与特定的一般分类账一起过账。从这一观察中得出,类似于Breunig等人。在[]中,我们区分了两类异常日记账分录,即全局异常和局部异常:全局会计异常是指与扭曲属性相关的日记账分录,例如,很少使用的分类账或异常记账时间。

8
kedemingshi 在职认证  发表于 2022-6-24 13:16:31
传统上,“红色-ag“审计人员进行的测试然而,此类测试通常会导致大量的假阳性”欺诈“.Local accounting Anomalies是一种日记账分录,表现出不寻常或罕见的属性值组合,而其个别属性值出现得相当频繁,例如KDD ADF\'19(2019年8月5日,阿拉斯加州安克雷奇Schreyer and Sa)使用的总账账户或用户账户的不寻常组合arov等人。几个会计部门。这种类型的异常是严重的cantly more di公司邪教组织要侦查,因为犯罪者意图伪装成组织标准。我们的目标是学习一个模型,以无监督的方式检测两类异常日记账分录。因此,learnedmodel应该将日记账分录的数量划分为检测结果的数量。为了实现这一双重目标,我们利用了对抗式自动编码器(AAEs),一种由自动编码器神经网络(AEN)和Generativelowing组成的深层神经网络。更详细的介绍见【15】。3.2自动编码器神经网络Xnnx,x。。。,xneach journal entryxiconsists of Kattributesxi,xi。。。,xij。。。,xik。西吉西吉c详细信息,例如条目会计年度、记账类型、记账日期、金额、总账。Hinton和Salakhutdinov在[]引入了AENs,这是一种特殊类型的前馈多层网络,可以通过训练来重建其输入。形式上,AEN由两个称为编码器qθpθqθ(·)inputx的非线性函数组成∈ Rkto代码向量∈ rm称为潜在间隔表示,其中通常yk>m。该潜在表示ispθ(·)^x∈ 原始输入空间的RK。为了实现x≈^x对AEN进行训练,使给定日志的相异性最小化,其重建^xi=pθ(qθ(xi))与θ一样忠实*正式表示为:arg minθ∥xi- pθ(qθ(xi))∥.

9
能者818 在职认证  发表于 2022-6-24 13:16:34
(1) 3.3生成性对抗性神经网络GoodFellow等人在[16]中介绍了GANs,这是一个trainis学习生成器分布Q(x)的框架,该分布与日记账分录的真实数据分布PD(x)相匹配。而不是试图明确地表示yxiθqθq(x)z~ pn(z)qθ(z)通过对抗性鉴别器网络DД进行训练,该网络旨在学习一组参数Д以区分Pdq(z)之间的差异。该游戏的解决方案可以表示为:minqθmaxdДEx~pd(xi)[logdД(xi)]+Ez~pn(zi)[日志(1- dД(qθ(zi))]。(2) 3.4对抗性自动编码器AAE体系结构,如图2所示,通过在两个阶段(1)重建阶段和(2)对抗性正则化阶段联合对AEN潜在空间AAE施加任意先验,扩展了AEN的概念。在重建阶段,AAEs编码器网络qθ(z | x)q(z)xz后验分布对应于日记账分录特征的压缩表示。与AENs类似,decoderpθ(^x | z)表示sz重建日记账分录^Xas faithfullyas可以最大限度地减少AAEs重建错误。将AAE函数的编码器网络Qθ(z | x)用作生成器网络。此外,鉴别器网络DД(z)连接在学习到的潜在代码向量z的顶部。类似地,AAE的鉴别器网络被训练为区分P(z)z获得的聚合后验分布Q(z)。相反,enp(z)≈ q(z)q(z)p(z)3.5会计异常检测ERP数据集我们利用引入的AAE体系结构提出了一种新的异常评分。分数建立在整个AAE训练过程中适用的规则上,即重建误差损失,用公式(1)表示,以及对抗性损失,用公式(1)表示。

10
大多数88 在职认证  发表于 2022-6-24 13:16:37
(2) ,如下所述。重建损失促使AAE在一个高度“断裂”的潜在空间中学习一组非结果,在这个空间中,类似日记账分录的偏差表示被学习。另外,学习到的表征sz位于所施加的先验分布p(z)的高概率密度区域内。为了将潜在空间划分为语义区域,我们采用了多模态优先,例如高斯混合。因此,两种规则损失的相互作用迫使AAE学习强加先验的语义Sim组。因此,AAE通过渐进式培训学习,一种将日记账的基本生成过程分解的模型与日记账分录的独特生成过程相对应,例如折旧过账或供应商付款过账。为了检测潜在的会计异常,我们使用对抗式自动编码神经网络KDD-ADF’19,2019年8月5日,Anchorage,阿拉斯卡图3:“账户密钥”(技术上为:“KTOSL”)属性值(左)的示例分布,日志规范化的“本地”和“外币金额”(技术上为:“DMBTR”和“WRBTR”)属性值(中),以及数据集B中可观察到的“过账关键字”(技术上为“BSCHL”)和“总账账户”(技术上为“HKONT”)(右)。分录可以通过以下两种方式捕捉:(1)它们与先前强加模式的潜在差异,或(2)增加的重建错误。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:40