楼主: mingdashike22
661 13

[量化金融] 发现股票的语言 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.7616
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-6-23 20:20:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Discovering Language of the Stocks》
---
作者:
Marko Po\\v{z}enel and Dejan Lavbi\\v{c}
---
最新提交年份:
2019
---
英文摘要:
  Stock prediction has always been attractive area for researchers and investors since the financial gains can be substantial. However, stock prediction can be a challenging task since stocks are influenced by a multitude of factors whose influence vary rapidly through time. This paper proposes a novel approach (Word2Vec) for stock trend prediction combining NLP and Japanese candlesticks. First, we create a simple language of Japanese candlesticks from the source OHLC data. Then, sentences of words are used to train the NLP Word2Vec model where training data classification also takes into account trading commissions. Finally, the model is used to predict trading actions. The proposed approach was compared to three trading models Buy & Hold, MA and MACD according to the yield achieved. We first evaluated Word2Vec on three shares of Apple, Microsoft and Coca-Cola where it outperformed the comparative models. Next we evaluated Word2Vec on stocks from Russell Top 50 Index where our Word2Vec method was also very successful in test phase and only fall behind the Buy & Hold method in validation phase. Word2Vec achieved positive results in all scenarios while the average yields of MA and MACD were still lower compared to Word2Vec.
---
中文摘要:
股票预测一直是研究人员和投资者关注的领域,因为它可以带来巨大的经济收益。然而,股票预测可能是一项具有挑战性的任务,因为股票受到许多因素的影响,这些因素的影响随时间迅速变化。本文提出了一种结合NLP和日本烛台的股票趋势预测新方法(Word2Vec)。首先,我们从OHLC源数据创建一种简单的日语烛台语言。然后,使用单词句子来训练NLP Word2Vec模型,其中训练数据分类还考虑了交易佣金。最后,利用该模型对交易行为进行预测。根据获得的收益率,将所提出的方法与三种交易模式Buy&Hold、MA和MACD进行了比较。我们首先评估了Word2Vec在苹果、微软和可口可乐三家公司的股票上的表现,其表现优于比较模型。接下来,我们对罗素50强指数的股票进行了Word2Vec评估,我们的Word2Vec方法在测试阶段也非常成功,仅在验证阶段落后于买入持有法。Word2Vec在所有情况下都取得了积极的成果,而MA和MACD的平均产量仍然低于Word2Vec。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Discovering_Language_of_the_Stocks.pdf (632.67 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Applications candlesticks Quantitative Econophysics Mathematical

沙发
可人4 在职认证  发表于 2022-6-23 20:20:09
发现StocksMarko Pozenel和Dejan LavbicDejan Lavbic发现StocksArti官方情报和应用数据库及信息系统的语言X,315,pp.243-258,IOS出版社。股票预测一直是研究人员和投资者关注的领域,因为财务收益可能是巨大的。然而,库存预测可能是一项具有挑战性的任务,因为库存受到来自OHLC源数据的大量日本烛台的影响。然后,使用句子训练NLPWord2Vec模型,其中训练数据分类还考虑交易佣金。最后,该模型用于预测交易行为。根据获得的收益率,将所提出的方法与三种交易模式Buy&Hold、MA和MACD进行了比较。我们首先对苹果、微软和可口可乐三家公司的Word2Vec进行了评估,其表现优于比较模型。接下来,我们评估了Word2Vec,但在验证阶段仅落后于买入持有方法。Word2Vec在所有情况下都取得了积极的成果,而MA和MACD的平均产量仍然低于Word2Vec。关键词股票价格预测、Word2Vec、日本烛台、交易策略、NLP1简介投资者和研究界总是发现预测趋势和股票的未来价值有助于抵御市场风险(Kumar和Thenmozhi,2006)。考虑到研究领域的吸引力,出版了一种算法,该算法解决了可能最有利的问题之一。

藤椅
大多数88 在职认证  发表于 2022-6-23 20:20:12
couldHypothesis的一个原因是,价格立即包含了有关股票的所有可用信息,只有新信息才能改变价格变动(Cavalcante et al.,2016),因此不可能出现异常收益率Ballings et al.,2015)。在过去几十年中,一些经济学家对有效市场假说持怀疑态度,并对股价部分可预测的观点表示同情。其他人则声称,股票市场比许多最近的学术论文让我们相信的更有效,更不可预测(Malkiel,2003)。尽管如此,已经探索并提出了许多预测未来股票价值的方法(Cavalcante et al.,2016;Ballings et al.,2015)。更好的决策。股票市场分析最常用的两种方法是基本方法(Abad等人,《立法、市场趋势和在线可用数据》(Cavalcante等人,2016)。另一方面,技术分析对分析贸易活动的内部和外部特征不感兴趣,忽略了一些主观因素。技术分析基于这样一种假设,即影响公司股价的所有内部和外部因素都已间接包含在使用技术分析的文献中发表的几篇科学论文中,这些论文在股票预测方面提供了成功的方法(Cavalcante et al.,2016)。2010). 因此,有多种工具和技术可用,从传统的统计建模到计算智能算法(Cavalcante et al.,2016)。揭示金融市场供求的增长和下降。这是最古老的技术分析技术之一,起源于18世纪,Munehisa Homma将其用于大米贸易。时间跨度。

板凳
大多数88 在职认证  发表于 2022-6-23 20:20:16
今天几乎所有可用的软件和在线制图软件包(Jasemi et al.,2011)都包括标价高于开盘价。长方体上方和下方的细线称为定义名称。每个烛台都保存着交易时段的信息,当它是某个序列的组成部分时,它变得更加重要。我们的研究目标是从OHLC数据中定义一种简化的日语烛台语言。这种简化的OHLC语言被用作Word2Vec算法的输入(Mikolov等人,2013b),其结果是测试模型的财务成功或收益。其余的文件组织如下。第2节包含文献概述。第3节专门介绍了计量学。第5节介绍了结论和未来的工作。2相关工作此外,股票预测可被视为时间序列和机器学习科学界面临的主要挑战之一(Tay和Cao,2001)。然而,股票价格预测非常困难(市场是复杂、动态、非线性系统,受政治事件、经济前景、交易员2015)的影响)。近年来,文献中提出了几种股票价格预测方法(Teixeira似乎是支持向量机(SVM),而用于预测金融时间序列的最常用计算技术之一是(人工)神经网络(A)NN(Ballings et al.,2015)。神经网络在财务预测中非常流行的主要原因是,这种计算技术能够处理非线性、包含不连续性和高频多项式成分的数据(Liu和Wang,2012)。

报纸
大多数88 在职认证  发表于 2022-6-23 20:20:19
NN是数据驱动的自适应方法,能够捕捉时间序列的非线性行为,而无需对数据进行任何统计假设(Lu等人,2009)。规则用来向投资者发出买入或卖出股票的最佳时机的信号。系列它与多层反向传播(BP)神经网络进行了比较,并取得了显著更好的结果。实验数据来源于芝加哥商业市场,其中包含标准普尔500指数的数据,可替代BP神经网络进行金融时间序列预测。支持向量机预测,在大多数股票期货中,英国石油的表现明显好于英国石油,而在德国10年期政府债券中,英国石油的表现略好于英国石油。Lu和Wu(2011)提出了一种高效的小脑模型关节控制器神经网络(CMAC NN),通过使用高量化分辨率来加速多对少映射并减少泛化误差。他们将CMAC神经网络的性能与支持向量回归(SVR)和反向传播神经网络(BPNN)进行了比较,并取得了优异的结果。该方案比传统的统计和谱分析方法更易于使用。随机布朗波动率函数用于确定时间序列数据的权重。实验结果表明,该方法比简单的Legendren方法更能适应市场波动。在(Wang and Wang,2015)中,Wang等人引入了随机时效神经网络(STNN)和主成分分析模型(PCA),以预测股票指数SSE、HS300、S&P500和DJIA。在训练阶段,采用主成分分析方法从源数据中提取主成分。财务价格序列预测采用STNN模型。布朗运动用于确定(BPNN)、PCA-BPNN和STNN在金融时间序列预测中的程度。Hafezi等人。

地板
大多数88 在职认证  发表于 2022-6-23 20:20:22
(2015)还将神经网络纳入其股票价格预测模型,称为bat神经网络多智能体系统(BNNMAS)。他们提出了一个四层BNNMAS体系结构,其中每一层都有其目标技术分析,BNNMAS在长期内实现了模型的良好精度。他们证明了烛台分析对投资者有价值,这违反了有效市场假说(Fama,1960)。他们发现一些现有模式不适用,并将两种新模式显示为适用模式。Kamo和Dagli(2009)进行了一项研究,阐述了基本烛台模式和standardIF-THEN模糊逻辑模型。他们采用广义回归神经网络(GRNN)和基于规则的模糊门控网络。每个GRNN处理一个OHLC属性值,然后将其与模糊逻辑模型的最终预测相结合。他们将该方法与基于GRNN的烛台方法进行了比较,该方法具有简单的选通网络,性能更好。持续分析输入数据并更新技术规则。他们专注于通过静态选择规则和输入信号来发现方法中的转折点。不幸的是,作者没有提供数据,无论财务上的成功是在股票市场上获得的。Martiny(2012)提出了一种利用无监督机器学习从价格数据时间序列中自动发现重要烛台模式的方法。OHLC数据首先使用层次结构进行聚类。拟议技术的性能通过正确触发的买卖信号的百分比来衡量。尽管(Keogh和Lin,2005)的作者认为时间序列子序列的聚类是没有意义的。萨维奇(2016)探索了将日语烛台语言与自然语言处理相结合的想法。它通常用于将非结构化文本处理为技术分析。

7
大多数88 在职认证  发表于 2022-6-23 20:20:26
Word2Vec可以发现文档中单词之间的深层语义关系。在他们的工作中,Zhang等人(2015)证实了英语文本分类和聚类的表现(Mikolov等人,2013b,a,c)。我们雇佣了现有的研究人员使用Word2Vec预测未来的股票价值趋势。3拟定预测模型拟定预测模型。拟议方法背后的基本假设是,日本烛台不仅是可视化OHLC数据的强大工具,而且还包含预测能力(Jasemi等人,2011;Lu和Shiu,2012;Kamo和Dagli,2009;Lu,2014)。股票语言基础(即单词)由日本烛台定义。一种语言通常由词和词的模式组成,这些词和词的模式可以进一步组合成表达更深层含义的句子。该模型依赖于与自然语言的相似性。在预测过程开始时,对OHLC数据进行转换,生成日本烛台的简化语言,即股票语言。然后使用NLP算法Word2Vec(Mikolov et al.,2013b)处理所获得的语言,我们在其中使用以下子部分的给定特征训练模型。图1:拟议预测模型的步骤3.1 OHLC数据对于给定股票,我们观察了以下矩阵中定义的交易日和交易日的输入数据d(1×nd)X(4×nd)=dd。dnd公司OHLCOHLC。OndHndLndCnd(1) 其中,d(1×nd)是交易日的向量,X(4×nd)是OHLC交易数据的矩阵。时间价值。

8
kedemingshi 在职认证  发表于 2022-6-23 20:20:29
方程式(1)中的原始OHLC数据便于图形显示,但不适合进一步处理。3.2数据规范化我们对日本烛台的形状感兴趣,而不是绝对值,因此通过将OHLC数据属性(Open、High、Low、Close)与Open属性划分为以下标准,对OHLC元组进行了极大化hO、H、L、Ci= h1、HO、LO、COi:X→ X(2)利用方程(2)的变换,得到一个新的输入交易数据矩阵xx(4×nd)=HOLOCOHOLOCO。Hndondlndcndondondond(3) 图2:库存AAPL的20个OHLC图案簇示例,其中保留了日本烛台的形状。3.3烛台的字型识别形状(Martiny,2012)。我们的方法使用无监督机器学习方法自动检测烛台簇,这在之前的研究中是有益的(Martiny,2012;Jasemi等人,2011)。使用K-Means聚类的原因是为了限制可能的OHLC形状的数量(即保留的单词数,以获得最大的不同单词数)。在此过程中,我们定义了股票语言ASNW中的最大单词数,并使用K-Meansclustering算法将输入数据X转换为向量w,如下所示西北方向: 十、→ w(4)wiXicandlestick(簇i的平均值)。KMeans聚类的结果是一个向量(1×nd)=ww。wndT(5)其中给定的单词wii是一组可能的日语烛台中的元素,其中i=1,西北.nwnw(Rousseeuw,1987),它显示了一个对象与其他簇(分离)相比,在某个簇(内聚)中的位置有多好。

9
mingdashike22 在职认证  发表于 2022-6-23 20:20:32
剪影范围从-1到+1,通过控制nwand剪影度量,自然语言中也存在较高的平均剪影值。3.4从单词到句子的预测模型。通过对过去股票价值变动的分析,我们可以看出,日本烛台的序列具有一定的预测能力(Nison,1991;Lu and Shiu,2012)。因此,我们将OHLC的过去序列作为股票趋势预测的基础,形成未来可能的句子。从过去股票价值变动中获得的模式序列。我们指定了一个句子长度,定义了句子中连续单词(即交易日)的数量。因此,句子的数量取决于交易日的数量N和句子长度L,定义如下:N=nd- (ls- 1) (6)句子构建过程的结果是交易数据滚动窗口的内容矩阵(更具体地说,是vectorw中的股票语言中的单词)→ S、 包含lscolumns(句子长度)和nsrows(句子数量)的句子矩阵进一步定义为asS(ls×ns)=ww。wlsww。wls+1。wnswns+1。wnd(7) 似乎这种OHLC语言非常简单。然而,考虑到每个单词的可能值的数量,一组不同的可能句子或模式是巨大的。因此,定义的语言具有很高的表达能力,适合预测目的。3.5 Word2Vec培训按以下步骤执行预测。

10
mingdashike22 在职认证  发表于 2022-6-23 20:20:35
该系统利用历史数据,识别句子中的现有模式,学习单词的上下文,并通过使用Word2Vec算法(Mikolov et al.,2013b)训练上下文,根据新获取的数据更新上下文。带skip gram的Word2Vec算法(Mikolov et al.,2013b,a)使用一个模型来表示带有向量的单词,向量只包含一个隐藏级别,因此相对简单。其中许多模式可以表示为线性翻译。Word2Vec算法已被证明是分析自然语言的优秀工具,例如calculationvector(“Madrid”)- vector(\'Spain\')+vector(\'Paris\')产生的结果比任何其他单词vector更接近vector(\'France\')(Mikolov et al.,2013a,c)。mergingcontext的天数NWW和隐藏层权重矩阵中的神经元数量NV。Word2Vec算法执行以下转换W 2VS、 内华达州西北部: S→ W M(8),其中Word2Vec学习阶段的结果是权重矩阵,W M有nv列(向量数)和nwrows(股票语言中的单词数),定义如下W M(nv×nw)=v1,1v1,2。v1、nvv2、1v2、2。v2,nv。vnw,1vnw,2。vnw,内华达州(9) 用vi,jas表示单词wi的第j个向量(权重)。3.6培训数据分类触发以下操作之一:o买入、o卖出、o持有或不做。X半径y,其中y(1×nd)=AA。和T(10)YibuSellHoldLook aheaddays NLA,交易费vf EEA如下=0:购买nmax·Cj>nmax·Ci+2·vfee,j∈i、 i+nla1:销售nmax·Cj<nmax·Ci- 2·vfee,j∈i、 i+nla2:否则持有(11),其中ci是给定交易日的收盘价iandnmax=欧共体是以e作为初始股权进行交易的最大股票数量。3.7执行PredictionSoftMax算法(NN)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 17:52