楼主: 可人4
1191 12

[量化金融] 股票预测:用机器预测长期股价变动 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.0443
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-10 23:19:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Equity forecast: Predicting long term stock price movement using machine
  learning》
---
作者:
Nikola Milosevic
---
最新提交年份:
2018
---
英文摘要:
  Long term investment is one of the major investment strategies. However, calculating intrinsic value of some company and evaluating shares for long term investment is not easy, since analyst have to care about a large number of financial indicators and evaluate them in a right manner. So far, little help in predicting the direction of the company value over the longer period of time has been provided from the machines. In this paper we present a machine learning aided approach to evaluate the equity\'s future price over the long time. Our method is able to correctly predict whether some company\'s value will be 10% higher or not over the period of one year in 76.5% of cases.
---
中文摘要:
长期投资是主要的投资策略之一。然而,计算一些公司的内在价值和评估长期投资的股票并不容易,因为分析师必须关注大量财务指标,并以正确的方式进行评估。到目前为止,这些机器对预测公司在较长时期内的价值方向几乎没有帮助。在本文中,我们提出了一种机器学习辅助的方法来评估股票的未来长期价格。在76.5%的案例中,我们的方法能够正确预测某公司的价值在一年内是否会高出10%。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
--> Equity_forecast:_Predicting_long_term_stock_price_movement_using_machine_learning.pdf (1.04 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:股票预测 Quantitative Applications Application QUANTITATIV

沙发
能者818 在职认证  发表于 2022-5-10 23:19:35
股票预测:使用机器学习预测长期股价走势乌克尼科拉曼彻斯特大学计算机科学学院尼古拉·米洛舍维奇。milosevic@manchester.ac.ukAbstractLong定期投资是主要的投资策略之一。然而,计算一些公司的内在价值和评估长期投资的股票并不容易,因为分析师必须关注大量财务指标,并以正确的方式进行评估。到目前为止,机器对预测公司价值在较长时期内的走向几乎没有帮助。在本文中,我们提出了一种机器学习辅助的方法来评估股票的长期未来价格。在76.5%的案例中,我们的方法能够正确预测某公司的价值在一年内是否会高出10%。介绍在股票市场上交易股票是主要的投资活动之一。过去,投资者开发了许多股票分析方法,可以帮助他们预测股票价格的走势。基于当前的财务信息和新闻,对股票未来价格进行建模和预测,对投资者有巨大的用处。投资者想知道一些股票在一定时期内是上涨还是下跌。为了预测投资者希望投资的某家公司未来的表现,他们根据当前和过去的财务数据以及该公司的其他信息开发了许多分析方法。财务资产负债表和各种描述公司健康状况的比率是投资者进行技术分析的基础,以分析和预测公司未来的股票价格。

藤椅
能者818 在职认证  发表于 2022-5-10 23:19:39
预测股票价格的方向对于价值投资尤其重要。经验丰富的分析师可以应用一些基于过去数据证明的数学模型来评估公司的内在价值,比如格雷厄姆数。Graham number和Graham\'scriteria可能是最著名的模特之一(Graham,1949)。然而,由于当前市场的可用性增加,在今天的证券交易所里,可能不可能找到一家满足格雷厄姆原则的公司。由于这些变化,对调整模型的需求增加了。此外,股票市场随着时间的推移而变化(巴斯基和德隆,1992年;亨德肖特和莫尔顿,2011年)。引入了新的投资策略和新技术,使一些旧模式过时。自从金融素养提高以来,市场参与者比以往任何时候都多。然而,对于一些旧模型来说,股票市场的变化并不容易采用。在交易中引入算法无疑改变了股票市场。算法使得人们很容易对股市上的某些事件做出快速反应。机器学习算法还使分析师能够更容易地创建预测股票价格的模型。机器学习的引入使得可以根据过去的数据开发新的模型。在本文中,我们将描述使用几种机器学习算法预测股票市场价格的方法。我们的主要假设是,通过应用机器学习并根据过去的数据对其进行训练,可以预测股票价格的变动,以及在一定时间内变动的比率。特别是,我们希望确定一年内涨幅超过10%的股票。

板凳
mingdashike22 在职认证  发表于 2022-5-10 23:19:42
股票价格的涨跌百分比是可变的,然而,为了说明我们的情况,我们将重点关注10%的增长。到目前为止,投资者通常无法预测股价随时间增长的百分比。然而,这些信息对投资者在选择股票时至关重要。通常,投资者希望选择价格大幅上涨的股票。本文的组织方式如下:在第二节中,我们将回顾过去关于这一主题的相关工作。在第3节中,我们将描述我们使用的方法和算法。第4节描述了我们的方法在数据集上的结果。在最后一节中,我们将讨论该方法及其结果,与其他方法进行比较,并提出一些未来的工作。2相关工作Wilson和Sharda使用神经网络和经典的多重判别分析研究了预测公司破产,其中神经网络的表现明显优于多重判别分析(Wilson和Sharda,1994)。Min和Lee正在使用机器学习进行破产预测。他们评估了基于SVM、多元判别分析、逻辑回归分析和三层完全连接的反向传播神经网络的方法。他们的结果表明,支持向量机优于外部方法(Min&Lee,2005)。同样,Tam正在使用神经网络预测银行破产(Tam,1991)。李试图用支持向量机预测一家公司的信用评级。他们使用了各种财务指标和比率,如利息覆盖率、普通收入与总资产之比、净收入与股东权益之比、流动负债比率等。

报纸
何人来此 在职认证  发表于 2022-5-10 23:19:45
并获得了约60%的准确率(Lee,2007)。此外,还使用神经网络对这些公司的信用评级进行了预测研究,美国和台湾市场的预测准确率在75%到80%之间(Huang等人,2004年)。Phua等人进行了一项研究,预测了五大股指的走势:DAX、DJIA、FTSE-100、恒生指数和纳斯达克指数。他们使用神经网络,通过使用成分库存作为预测的输入,他们能够以高于60%的准确度预测价格变动的迹象(Phua等人,2003年)。将支持向量机应用于时间序列的方向预测。Kim(Kim,2003)在韩国股市的每日时间序列上训练SVM。他报告的命中率约为56%。Huang等人尝试使用支持向量机来预测日本日经225指数的每周走势。该方法在支持向量机上的命中率为73%,在组合模型上的命中率为75%。此外,SVM的表现也优于IR方法中的反向传播神经网络(Huang等人,2005)。Schumaker和Chen研究了通过使用SVM分析文本文章可以实现的预测。他们试图在消息发布20分钟后预测标准普尔500指数的走势。他们使用了多种方法,如单词袋、名词短语和命名实体,并实现了57%的定向命中率(Schumaker&Chen,2009)。然而,对文本新闻的分析不在本研究的范围之内。蔡和王进行了一项研究,他们试图通过使用集成学习来预测股票价格,集成学习由决策树和人工神经网络组成。他们根据台湾股市数据创建了数据集,考虑了基本面指数、技术指数和宏观经济指数。在台湾证券交易所数据上训练的DT+ANN的性能显示F分数性能为77%。

地板
能者818 在职认证  发表于 2022-5-10 23:19:49
单一算法的F-score性能高达67%(Tsai&Wang,2009)。据作者所知,他不知道有任何关于预测股票市场在较长时间后的股价的工作。我们对长期投资感兴趣,即投资者持有股票的时间延长。在下面的章节中,我们将研究机器学习辅助的方法,用于分析和预测特定股票在延长的时间段内的增长。3.方法3。1数据集使用彭博终端获取数据集。我们从标准普尔1000指数、富时100指数和标准普尔欧洲350指数中挑选股票。我们总共挑选了1739只股票。对于每只股票,我们在2012年第一季度至2015年最后一季度的每个季度末获得了股票价格。除了价格,我们还检索了数据集中每家公司的以下财务指标:账面价值——公司的净资产价值,由总资产减去无形资产(专利、商誉)和负债计算。市值——公司已发行股本的市值;它等于股价乘以流通股数量。一个月内股票净价的变化一个月内股票净价的变化百分比股息收益率-表明公司每年支付的股息相对于其股价的比例。每股收益——公司利润除以已发行股份数的一部分。

7
nandehutu2022 在职认证  发表于 2022-5-10 23:19:52
每股收益是公司盈利能力的一个指标。每股收益增长——在随后一年内每股收益的增长。销售收入营业额净收入——资产销售的收益,减去佣金、税费或与销售有关的其他支出。净收入增长——在随后一年内净收入的增长。销售增长——随后一年的销售增长。市盈率——衡量公司当前股价相对于每股收益的比例。市盈率,五年平均值——五年期间的平均市盈率。市盈率——将公司当前市价与其账面价值进行比较。销售价格比率——公司市值除以最近一年的收入计算得出的比率。每股股息——指全年支付的股息总额除以发行的普通股数量。流动比率——将公司的流动资产与其流动负债进行比较。速动比率——将现金、有价证券和应收账款总额与流动负债总额进行比较。总负债与权益比率——用来衡量公司财务杠杆的比率,计算方法是将公司的总负债除以股东权益。分析师比率–分析师给出的比率。按5年复合年增长率调整的收入增长利润率利润率——计算为净收入除以收入或净利润除以营业利润率的利润率——用于衡量公司定价策略和运营效率的比率。

8
mingdashike22 在职认证  发表于 2022-5-10 23:19:56
这是一个衡量公司在支付可变生产成本(如工资、原材料等)后剩余收入比例的指标。资产周转率——公司销售额或产生的收入相对于其资产价值的比率。3.2预测股价变动方法我们将预测股价变动的任务建模为分类任务,其中我们将在一年内股价上涨10%的股票归类为“好”股票,将其他股票归类为“坏”股票。由于我们有从彭博终端检索到的历史数据,我们创建了一个数据集,其中包含一年多前某个历史日期的指标值和价格。我们用Python创建了一个脚本,将历史价格与第一次价格测量一年后的价格进行比较。如果价格高出10%,脚本会将数据点标记为“好”,否则标记为“坏”。创建良好的机器学习模型需要平衡的数据集(Ganganwar,2012;Akbani,etal.,2004)。为了创建这样一个数据集,我们只选择了与比率和指标定义相同数量的股票http://www.investopedia.com/和http://lexicon.ft.com/“好”是指被标为“坏”的股票。由于我们的数据集包含1739只股票,我们需要丢弃一些股票,因为它们会使我们的数据集失衡,所以我们的数据集包含1298个数据行(649个标记为好,649个标记为坏)。这些数据行包含2014年最后一个季度的股票指标。标签是根据2015年最后一个季度的价格比较制作的。2014年。然而,由于我们有历史数据,我们在2014年的最后一个季度之前创建了额外的数据行。,一年后的价格。

9
mingdashike22 在职认证  发表于 2022-5-10 23:20:00
我们的最终数据集包含4538个数据行。由于我们的数据集中并非所有公司的所有财务指标都可用,因此我们将值9999指定为不存在或不可用的值。我们在Weka toolkit(Hall,etal.,2009)中使用了几种分类机器学习算法来训练模型。我们用C4训练模型。5决策树,支持向量机与序列最小优化,JRip,随机树,随机森林,逻辑回归,朴素贝叶斯和贝叶斯网络。首先,我们使用所有指标和历史价格作为特征,对所有这些算法进行了10倍交叉验证。然后,我们通过移除特征并评估算法的性能是提高还是降低来执行手动特征选择。我们反复执行这个过程,直到我们没有得到具有最少功能和最佳性能的最佳模型。4结果表1列出了10倍交叉验证期间所有特征(财务指标)的结果。表1:基于所有财务指标的机器学习预测结果算法PrecisionRecallf-scoreC4。5决策树0。6870.6870.687SVM和SMO0。6390.6300.624JRip0。6350.6350.635随机树。6680.6680.668随机森林0。7510.7510.751逻辑回归。6430.6370.633五个海湾0。5450.5300.487贝叶斯网络0。6250.6180.612表现最好的算法是精度、召回率和F分数为75.1%的随机森林。我们还进行了配对t检验,显著性水平为0.05。

10
大多数88 在职认证  发表于 2022-5-10 23:20:04
随机森林算法的性能明显优于其他算法。为了提高随机森林的性能,尝试以最优的方式选择特征。我们手动执行特征选择,选择特定的特征集并重新评估结果。在这个迭代过程结束时,选择了11个性能最好的特性。最初的功能集有28个功能。虽然一些特征对最终结果没有影响或负面影响,但一些比率所表明的事实与其他比率重复,因此它们是不必要的。在我们的测试中,只有11个特性对性能有贡献的随机林的精度、召回率和F分数为0.762。正确分类的实例的百分比为76。2%,在实验中使用10倍交叉验证进行评估。我们选择的功能如表2所示。表2:显示最佳性能的选定功能Tributebook_valuemarket_Capdivident_YIELDBEST_EPSPE_RATIOPX_TO_BOOK_RATIOBEST_DPSCUR_RATIOQUICK_RATIOQUICK_DEBT_TO_TOT EQYhistory_Price我们还评估了其他算法,我们之前在具有选定功能的数据集上使用过这些算法。结果见表3。表3:基于机器学习的权益预测结果,使用10倍交叉验证和11个选定特征算法MPRecisionRecallf-scoreC4。5决策树0。6600.6600.660SVM和SMO0。6360.6290.624JRip0。6400.6390.639随机树0。7000.7000.7000。7650.7650.765逻辑回归。6380.6300.625天真的海湾。5260.5150.453贝叶斯网络0。6410.6260.615在选定的特征中,随机森林仍然是性能最好的算法,它们的性能略微提高了1.4%。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 01:22