楼主: mingdashike22
819 25

[量化金融] 挖掘股票非法内幕交易:一种积极的方法 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-10 05:43:06
因为用传统的优秀机器学习方法很难预测时间序列数据,如图9所示。异常时间序列(以天为基础)。图10:。NCR(按日计算)。(例如,SVM),这些初步实验表明,使用基于深度学习的技术(如LSTM RNN)可以实现潜在的良好结果,特别是在我们提出的框架内,我们可以控制我们想要使用多少信息来进行更好的预测(例如,对于基于窗口的预测,只使用前一个窗口来预测下一个窗口)。最后,图13和表1显示了我们在实验中应用的三种LSTM RNN变体的比较。首先,基于日的预测方法优于其他方法,因为它能够检测命中率最高的所有正常模式。基于日期的预测性能更好,因为它使用该窗口所有前几天的真实历史记录。但这种方法的局限性在于,它可以预测的提前天数只有一天。另一方面,基于窗口的预测方法在前一个窗口的基础上提前预测整个窗口(50天),因此其性能如图11所示。异常时间序列(基于整个历史)。图12:。NCR(基于整个历史)。比白天的预测要差一点。最后,整个基于历史的预测方法在使用整个历史数据集进行预测时执行worstas,这对于时间序列预测是不切实际的。此外,表一显示了发现异常模式的模式结果(按方法分组)。前两种模式(模式1和模式2)在整个时间序列中多次在所有公司中检测到。但实际的非法内幕交易案件只针对两个不同时间段的两家不同公司。

22
何人来此 在职认证  发表于 2022-6-10 05:43:10
因此,我们的方法确定了几个可疑的时间序列,其实际性质可能不仅是非法内幕交易,还可能包括其他潜在的金融欺诈情况。然而,也可能存在误报。减少误报的一种可能性是增加NCR相关阈值(目前设置为0.80),但这也会导致丢失一些异常模式。为了验证这些异常模式的指标有多好,我们还对谷歌的父母表IPATTERN-WISE-HITPattern%公司总点击量窗口日历史1 100%74 8 66 02 100%128 116 8 43 28.57%5 0 5 04 57.14%4 0 4 05 71.42%76 11 65 06 28.57%10 1 9 07 14.29%1 0 8 14.29%4 0 9 14.29%1 0 10 10 10 10 14.29%1 0 11 11 14.29%1 0 10图13。不同方法的性能。Alphabet股份有限公司成立于2015年,目前尚未报告任何非法内幕交易案件。我们发现相关系数为。94及以上没有可用的异常模式。当我们将以下值减至时。94,一些时间跨度被标记为与异常模式(非法内幕交易时间序列)相似,我们已从历史数据中确定为真实交易案例。正确预测非法内幕交易几乎就像正确预测股市价格一样困难。我们所能做的就是使用不同的科学方法进行有根据的猜测。如果时间序列被确定为可疑,那么它可能是合法或非法的结果。如果它是非法的,那么它可以是任何类型的欺诈活动。由于Wettraining模型使用了一些真正的非法内幕交易模式,因此我们模型的预测很有可能是实际的非法内幕交易。

23
nandehutu2022 在职认证  发表于 2022-6-10 05:43:13
积极采用我们的方法采取措施,可以在非法内幕交易的官方新闻发布之前减轻市场的损害。毕竟,内幕人士可能知道常见的内幕交易模式,可能想要逃避检测。这是我们数据集的一个已知限制,未来我们将尝试集成更多的数据源(如社交媒体)来解决这个问题。五、 结论在这项工作中,我们介绍了如何通过分析结构化和非结构化数据的异构来源,主动预测和检测法律内幕交易(在官方新闻发布之前)。我们还展示了一种有效的方法(即基于树的可视化),可以直观地向分析师表示非结构化数据,以便更好地理解和减少搜索空间。我们的目标是通过基于树的可视化识别的公司,也被美国证券交易委员会认定为突出的非法内幕交易案件。对于目标公司,从分析的上市和历史股票数据中,我们发现了非法的内幕交易模式(异常模式)。之后,我们使用DLSTM RNN使用三种方法预测股票交易量。之后,我们使用我们提出的算法来查看任何时间跨度(实际或预测)是否与发现的异常模式匹配。我们发现,我们的算法在检测受影响公司和非受影响公司的正常模式方面都有很好的成功率。这项研究的一个局限性是,我们无法将我们的结果与任何类似的先进工作进行比较,因为我们的工作是(据我们所知)从真实诉讼案件中发现特定非法内幕交易的第一项工作。这项研究的未来方向是与更多的公司一起尝试预测和检测部分,以查看其有效性。

24
nandehutu2022 在职认证  发表于 2022-6-10 05:43:16
此外,测试并比较这项工作的预测部分与其他一些算法(如GAM、ARIMA),这些算法可以很好地进行时间序列预测。感谢Jakob Aungiers使用LSTM RNN实现了基于Python的股价预测。在我们实验的第一部分,他的代码对我们帮助很大。我们将他的代码用作模板,调整了一些参数,并对其进行了修改以适应我们的实验。参考文献[1]K.Golmohmadi、O.R.Zaiane和D.D'iaz,《使用监督学习算法检测股市操纵》,数据科学与高级分析(DSAA),2014年。IEEE,2014,第435–441页。[2] 《2007年金融犯罪报告》,2010年5月。[在线]。可用:https://www.fbi.gov/stats-services/publications/fcs2007年报告【3】L.A.Jeng、A.Metrick和R.Zeckhauser,“估计内幕交易回报:绩效评估视角”,《经济学与统计评论》,第85卷,第2期,第453-4712003页。[4] K.Golmohammadi和O.R.Zaiane,“用于检测股市操纵的时间序列上下文自动检测”,摘自数据科学和高级分析(DSAA),2015年。36678 2015. IEEE,2015,第1-10页。[5] D.Diaz、B.Theodoulisis和P.Sampaio,“利用知识发现技术分析股票市场操纵,并将其应用于日内交易价格”,专家系统与应用,第38卷,第10期,第12 757–12 7711911页。[6] F.Allen和D.Gale,“股价操纵”,《金融研究评论》,第5卷,第3期,第503-5291992页。[7] 曹永明,李永明,S.A.科尔曼,A.贝拉特雷什,T.M.麦金尼蒂等,“价格操纵检测中具有异常状态的自适应隐马尔可夫模型。”IEEE Trans。神经网络。学习系统。,2015年第26卷第2期,第318-330页。[8] D.Cumming、S.Johan和D.Li,“交易所交易规则和股票市场流动性”,《金融经济学杂志》,第99卷,第。

25
可人4 在职认证  发表于 2022-6-10 05:43:19
2011年第651–671页,第3页。[9] H.Jia,“长短期记忆网络对股价预测有效性的调查”,arXiv预印本XIV:1603.078932016。[10] Y.Song、L.Cao、X.Wu、G.Wei、W.Ye和W.Ding,“基于群体的市场操纵中捕获耦合关系的耦合行为分析”,第18届ACM SIGKDD国际知识发现和数据挖掘会议论文集。ACM,2012年,第976-984页。[11] M.M.Z.Ali和B.Theodoulis,“使用基于语言学的文本挖掘方法分析股市欺诈案例。”在WaSABi FEOSW@ESWC,2014年。[12] M.Mantere,“利用网络攻击操纵股市,通过社交媒体传播错误信息”,2013年社会计算国际会议。IEEE,2013,第950–954页。[13] K.R.埃亨,“信息网络:来自非法内幕交易提示的证据”,《金融经济学杂志》,第125卷,第1期,第26-47页,2017年。[14] “雅虎金融-商业金融、股票市场、报价、新闻”,https://finance。雅虎。com/,(2018年7月27日访问)。[15] “Sec.gov-诉讼解除”https://www.sec.gov/litigation/litreleases.shtml,(2018年7月27日访问)。[16] “Sec执法行动:内幕交易案件”https://www.sec.gov/spotlight/insidertrading/cases.shtml,(2018年7月27日访问)。[17] 《联邦调查局2010-2011年金融犯罪报告》https://www.fbi.gov/stats-services/publications/《金融犯罪报告》(Financial-crimes-report-2010-2011)(2018年7月27日查阅)。[18] P.Geurts、D.Ernst和L.Wehenkel,“极端随机树”,机器学习,第63卷,第1期,第3-42页,2006年。[19] S.R.Islam、W.Eberle和S.K.Ghafoor,“使用组合机器学习和启发式方法的信用违约挖掘”,2018年国际数据科学会议记录(ICDATA)。ACSE,2018年,第16-22页。[20] S.R。

26
kedemingshi 在职认证  发表于 2022-6-10 05:43:22
Islam,“从olap和oltp中挖掘不良信用账户的有效技术”,田纳西理工大学博士论文,2018年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 12:43