楼主: mingdashike22
813 25

[量化金融] 挖掘股票非法内幕交易:一种积极的方法 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-6-10 05:42:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Mining Illegal Insider Trading of Stocks: A Proactive Approach》
---
作者:
Sheikh Rabiul Islam, Sheikh Khaled Ghafoor, William Eberle
---
最新提交年份:
2018
---
英文摘要:
  Illegal insider trading of stocks is based on releasing non-public information (e.g., new product launch, quarterly financial report, acquisition or merger plan) before the information is made public. Detecting illegal insider trading is difficult due to the complex, nonlinear, and non-stationary nature of the stock market. In this work, we present an approach that detects and predicts illegal insider trading proactively from large heterogeneous sources of structured and unstructured data using a deep-learning based approach combined with discrete signal processing on the time series data. In addition, we use a tree-based approach that visualizes events and actions to aid analysts in their understanding of large amounts of unstructured data. Using existing data, we have discovered that our approach has a good success rate in detecting illegal insider trading patterns.
---
中文摘要:
股票非法内幕交易的基础是在信息公开之前发布非公开信息(如新产品发布、季度财务报告、收购或合并计划)。由于股票市场的复杂性、非线性和非平稳性,很难发现非法内幕交易。在这项工作中,我们提出了一种方法,使用基于深度学习的方法结合时间序列数据的离散信号处理,从大量异构的结构化和非结构化数据源中主动检测和预测非法内幕交易。此外,我们使用基于树的方法来可视化事件和操作,以帮助分析人员理解大量非结构化数据。利用现有数据,我们发现我们的方法在检测非法内幕交易模式方面有很好的成功率。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Mining_Illegal_Insider_Trading_of_Stocks:_A_Proactive_Approach.pdf (909.95 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:内幕交易 unstructured Applications Quantitative Econophysics

沙发
可人4 在职认证  发表于 2022-6-10 05:42:06
挖掘股票非法内幕交易:积极主动的方法美国田纳西理工大学库克维尔分校伊斯兰计算机科学。sislam42@students.tntech.eduSheikh美国田纳西理工大学库克维尔分校哈立德·加福计算机科学。sghafoor@tntech.eduWilliam美国田纳西理工大学库克维尔分校。weberle@tntech.eduAbstract-股票非法内幕交易的基础是在信息公开之前发布非公开信息(如新产品发布、季度财务报告、收购或合并计划)。由于股票市场的复杂性、非线性和非平稳性,很难发现非法内幕交易。在这项工作中,我们提出了一种方法,该方法使用基于深度学习的方法,结合时间序列数据的离散信号处理,从大型异构结构化和非结构化数据源中主动检测和预测非法内幕交易。此外,我们使用基于树的方法来可视化事件和操作,以帮助分析人员理解大量非结构化数据。利用现有数据,我们发现我们的方法在检测非法内幕交易模式方面有很好的成功率。股票市场;神经网络;自然语言处理;时间序列预测;非法内幕交易;一、 股票市场是股票、债券和其他形式的证券发行和交易的市场和交易所的集合。它为公司提供了进入capitalin exchange的途径,以获得投资者的部分所有权。世界上最大的证券交易所是纽约证券交易所(NYSE)。纳斯达克是美国第二大证券交易所。S、 ,大多数科技公司都参与其中。证券交易委员会(SEC)是监管美国。

藤椅
kedemingshi 在职认证  发表于 2022-6-10 05:42:09
股票市场证券欺诈是与证券发行和出售相关的欺诈行为。根据美国联邦调查局(FBI)的报告[2],以下是当今证券市场上最常见的欺诈类型:1)市场操纵对一些通常交易量较低的股票造成了艺术性购买压力,这些股票主要由作案者控制。这导致肇事者非法获利,无辜和天真的投资者蒙受损失。市场操纵破坏了公平有序的市场;2)深夜交易在正常交易时间后非法买卖证券。这种类型的交易受到限制,因为重要的市场影响决定在常规交易结束后发布,3)高收益投资欺诈提供低风险或无风险投资,以保证异常高的回报率。股票市场的内幕交易是基于非公开信息的交易。美国的内幕交易是一种常见的活动[3]。它可以是合法的,也可以是非法的。合法的内幕交易需要遵循监管机构的适当指导方针。另一方面,如果在信息公开之前根据非公开(私人、泄露、举报)信息(例如新产品发布、季度财务状况、收购或合并计划)进行交易,则会发生非法信息交易。非法内幕交易的发现和股票价格的正确预测是一个具有挑战性的问题。传统技术不能充分解决这些问题。为了了解股票市场的复杂性,需要新的方法和技术。例如,人工神经网络(Arti-ficialneuralnetwork,ANN),一种根据哺乳动物大脑皮层的神经结构进行松散建模的方法,在这方面可能很有用。

板凳
kedemingshi 在职认证  发表于 2022-6-10 05:42:14
神经网络被组织成相互连接的节点层。模式通过输入层由神经网络表示,输入层连接到一个或多个隐藏层。这些层最终是输出层,在输出层中生成输入模式的结果。然而,常规的神经网络对于时间序列或序列数据并不能很好地工作,因为它们缺乏对过去事件的记忆(即存储)。因此,更流行的神经网络技术是递归神经网络(RNN),其中神经元的输出再次反馈给神经元的输入。然而,虽然这给神经元提供了一些记忆(有限的和连续的),但它仍然面临着消失/爆发梯度问题。此外,当远处的梯度贡献变为零时,网络的学习率迅速下降。另一方面,长-短期记忆网络(LSTM)克服了RNN的一些问题。与前馈网络不同,LSTM可以在内存中保留任何数量的前一步(根据需要),并在需要时忘记这些步骤。它还有助于以一种更可控的方式管理内存:哪些信息需要保留,哪些信息需要更新,哪些信息需要忘记,哪些信息需要在更长的时间内关注。这就是为什么LSTMis在时间序列预测中非常有用的原因,在时间序列预测中,数据可能具有季节性(随时间变化的行为周期)、噪声(无法用模型正确解释的数据变化)和趋势(随时间变化的行为增加或减少)。贡献:我们在这项工作中的主要贡献是使用LSTM RNN预测一些目标公司的股票量,然后使用我们提出的算法反常,我们将能够检测预测数据中的异常模式,这可能是非法内幕交易的影响。

报纸
kedemingshi 在职认证  发表于 2022-6-10 05:42:17
其他贡献还在数据预处理阶段:A)从大量诉讼相关新闻稿(SEC诉讼档案)中对非法内幕交易案件进行分类;B) 实施基于atree的方法,将事件和操作可视化,以帮助分析员理解大量未结构化数据(例如,诉讼相关新闻稿)。我们的实验结果支持:(1)有可能在短时间内从受影响和未受影响公司的amix中检测出Tillegal内幕交易;(2)有可能对大量非结构化数据进行分类并直观地可视化。通常,当证券交易案件太晚,没有任何可采取行动的情报时,投资者就会意识到非法内幕交易。因此,我们提出的是一种基于计算智能的方法,该方法可以分析来自不同来源的数据,并在该信息的官方新闻发布之前很久就检测出潜在的非法内幕交易活动。据我们所知,这是首次利用计算智能从另一个数据源中挖掘非法内幕交易的全面尝试,因此限制了我们将我们提出的方法与其他相关工作进行全面比较的能力。在下面的章节中,我们将介绍之前关于预测股市操纵的研究。然后描述我们使用的数据集,包括数据预处理。然后,我们将介绍我们的实验、结果和分析,然后是一些结论性观察和未来的工作。二、背景在文献[4]的工作中,作者提出了一种针对股票市场复杂时间序列数据的上下文异常检测方法(CAD)。异常检测方法在这里被视为上下文或局部异常检测方法,基于类似公司在一年中的任何时间都会表现出类似行为的信息。

地板
何人来此 在职认证  发表于 2022-6-10 05:42:20
在本研究中,研究了五组异常检测方法:基于窗口的、基于近似值的、基于预测的、基于隐马尔可夫模型的和基于分段的。它们都有各自的优缺点。根据作者的说法,它们都不是这种基于时间序列的异常检测的完美候选者。相反,他们提出了一种上下文异常检测方法,他们发现该方法优于其他最先进的方法,如KNN和随机游走。我们在这项工作中使用的STM RNN使用基于日期、基于窗口和基于整个历史的预测。Golmohammadi等人[1]提到,现有的欺诈检测方法严重依赖于基于专家知识的一组规则。然而,当前的股票市场本质上更具动态性,犯罪者不断发现新方案,因此需要可扩展的机器学习算法来识别市场操纵活动。他们应用了不同类型的机器学习算法,如朴素贝叶斯、支持向量机、CART、KNN和随机森林。实证结果表明,朴素贝叶斯在F2测度方面优于其他学习方法。[1]的工作实际上是迪亚兹等人工作的延伸。[5]. 根据作者的说法,有三种技术严重助长了市场操纵:1)在一天结束或最后一个季度买入或卖出股票,以影响收盘价;2)洗牌交易(预先安排的交易),这些交易将在稍后逆转或对买卖双方没有实际风险;3)通过获得大部分股票来垄断市场。这项工作中使用的数据集与Diaz等人的工作中使用的数据集相同。该数据集包含SEC在2003年1月至12月期间报告的市场操纵案例,其中包括31只不同股票、8只操纵股票和25只与操纵股票相似的股票。

7
nandehutu2022 在职认证  发表于 2022-6-10 05:42:23
我们在工作中使用的数据集包含诉讼档案起始年(1996年)到2018年的数据,我们的重点缩小到预测非法内幕交易,这是一种更难发现和预测的股市欺诈类型。根据文献[6],股市滥用主要有三种方式:1)基于信息的操纵,即发布财务谣言以影响价格;2) 基于行动的操纵,即股票供求受到挤压,以进行操纵;以及3)基于交易的操纵,即通过买卖进行操纵,这使得很难将其归类为非法。此外,非法内幕交易主要通过买卖进行,因此很难发现或预测。此外,无法从单一行动的事件中检测到价格操纵。相反,大多数情况下,它是由一系列随着时间推移而演变的动作和操纵策略组成的,当操纵行为与大量正常记录混合时,操纵行为并不明显。根据[7]和[8],价格操纵可以以多种不同的形式完成。例如,投资者在4月份输入远高于/低于实际出价或要价的买入/卖出指令(有时称为“欺骗指令”),这就产生了与前一指令相反的“善意”指令所带来的虚假利益。另一个例子是Pump&Dump,操纵者通过以操纵价格快速出售长期持有的股份来获利。Diaz等人[5]表明,使用知识发现技术可以从每小时的事务数据中发现操纵模式。

8
何人来此 在职认证  发表于 2022-6-10 05:42:26
他们采用开放式方法,使用新闻来源、财务比率、变量等异构来源来描述日内(即每小时)交易。本研究使用的数据集基于美国证券交易委员会(SEC)发布的股票市场操纵案例,也是我们将在工作中使用的数据集。在贾[9]的工作中,探索了LSTM在股票价格预测中的有效性。虽然这项研究与任何类型的欺诈或操纵检测无关,但它仍然可以被归类为操纵检测过程。在Song等人[10]的工作中,作者提出了一个通用耦合行为分析(CBA)框架,通过捕获更全面的耦合来检测基于群体的市场操纵。多组操纵者相互协作操纵股票价格,这对股票市场监管来说是一个巨大的挑战。他们的方法比以前的基准耦合隐马尔可夫模型(CHMM)表现更好,这种表现的主要原因是股票之间有适当的领域知识。在Zaki等人[11]的工作中,他们提出了一种基于语言学的文本挖掘方法,以展示从SEC诉讼释放(LR)中提取财务概念(例如,相关方、管辖权、欺诈者的财务收益)的过程。他们使用财务本体从美国证券交易委员会诉讼发布中捕获财务欺诈概念。这有助于金融分析师了解起诉案件中不同的操纵模式。然而,他们的工作对诉讼案例研究的数量有限制。通常,可以研究的诉讼案件越多,结果就越不偏斜。另一方面,我们正在使用基于树的方法,这将有助于分析人员筛选他们需要检查的案例数量。

9
何人来此 在职认证  发表于 2022-6-10 05:42:29
此外,我们提出的方法有助于提前挖掘潜在的非法内幕交易(即预测)。在Mantere等人[12]的工作中,他们提出了一个假设性的案例研究,即利用网络攻击和通过社交媒体传播的虚假信息操纵股市,从而使虚假新闻以有利的方式影响市场。到目前为止,我们已经找到了多种检测股市操纵欺诈的方法。一些方法基于对等群体分析,一些基于上下文本体检测,一些基于基于语言的文本挖掘,还有一些使用财务本体。在检测股票市场的非法内幕交易方面,很少有研究。[13]的工作是基于内幕交易,但研究只是分析内幕交易案例。据我们所知,我们提议的是一种更全面的方法来检测非法内幕交易。据我们所知,由于这项工作的新颖性,我们无法将我们的工作与其他方法进行比较。图1:。拟议技术的流程图。三、 方法学。拟议技术图1是我们实施的技术的流程图。起初,我们的目标公司(图1,标记为A)是通过基于树的可视化(本文稍后讨论)识别出来的,同时也被SEC认定为突出的非法内幕交易案件。然后,我们从Yahoo Finance收集了目标公司的历史股票交易量数据。当内幕人士获悉非公开信息时,收集的股票交易量数据的起始日期比从分析的案例和新闻稿中获取的日期早三个月。收集的库存量数据的截止日期是我们进行这些测试的日期。

10
可人4 在职认证  发表于 2022-6-10 05:42:32
我们收集了目标公司在这些开始和结束日期内的全天股票交易量(图1,标记为B)。在模式发现阶段(图1,标记为C),当内部人员了解非公开信息并根据该信息进行交易时,我们选择窗口(窗口是连续50天的交易量集合)。我们发现,在大多数情况下,内幕人士在获悉非公开信息的很短时间内(一到两天)完成交易。因此,我们为目标公司选择了50天的交易量,这样内幕人士得知非公开信息的日期就在在中间。一些公司多次面临非法内幕交易(如富国银行),因此我们从这些公司那里获得了多种模式(窗口)。通过这种方式,我们生成了所有非法内幕交易模式,这是我们异常检测算法的基本事实。我们的下一个任务是预测特定时期目标公司的库存量(图1,labeledas B和C),并将发现的模式作为滑动窗口传递给它以查看相似性。因此,对于选定的公司,我们使用三种不同的方法将LSTM RNN应用于历史股票交易量数据:1)基于前一个交易量窗口预测未来的交易量窗口(例如50天),2)基于前一个交易量窗口预测前一天的交易量,和3)根据所有以前的交易量数据预测未来的交易量窗口。需要指出的是,我们将一个窗口定义为连续N天的集合。在这项工作中,我们使用大小为50的窗口,这与Jia等人使用的窗口大小相同。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 05:47