楼主: 能者818
1189 24

[量化金融] 基于主成分的股价预测 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.5040
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-6-9 18:41:45 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Stock Price Prediction using Principle Components》
---
作者:
Mahsa Ghorbani, Edwin K. P. Chong
---
最新提交年份:
2018
---
英文摘要:
  The literature provides strong evidence that stock prices can be predicted from past price data. Principal component analysis (PCA) is a widely used mathematical technique for dimensionality reduction and analysis of data by identifying a small number of principal components to explain the variation found in a data set. In this paper, we describe a general method for stock price prediction using covariance information, in terms of a dimension reduction operation based on principle component analysis. Projecting the noisy observation onto a principle subspace leads to a well-conditioned problem. We illustrate our method on daily stock price values for five companies in different industries. We investigate the results based on mean squared error and directional change statistic of prediction, as measures of performance, and volatility of prediction as a measure of risk.
---
中文摘要:
文献提供了强有力的证据,证明股票价格可以从过去的价格数据中预测。主成分分析(PCA)是一种广泛使用的数学技术,通过识别少量主成分来解释数据集中发现的变化,对数据进行降维和分析。在本文中,我们描述了一种基于主成分分析的降维操作,利用协方差信息进行股价预测的通用方法。将噪声观测投影到主子空间会导致一个条件良好的问题。我们举例说明了我们对不同行业的五家公司的每日股价值的方法。我们研究了基于预测均方误差和方向变化统计的结果,作为绩效的衡量标准,以及基于预测波动性的结果,作为风险的衡量标准。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
--> Stock_Price_Prediction_using_Principle_Components.pdf (384.85 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:主成分 Mathematical Quantitative mathematica Identifying

沙发
kedemingshi 在职认证  发表于 2022-6-9 18:41:50
利用主成分进行股价预测,*, Edwin K.P.ChongbaElectrical and Computer Engineering department,Colorado State UniversitySystems Engineering department,Colorado State University摘要文献提供了强有力的证据,证明股票价格可以从过去的价格数据中预测。主成分分析(PCA)是一种广泛使用的数学技术,通过识别少量主成分来解释adata集合中发现的变化,从而对数据进行降维和分析。在本文中,我们描述了一种基于主成分分析的降维操作,利用协方差信息进行股票价格预测的一般方法。将噪声观测投影到主子空间会导致一个条件良好的问题。我们举例说明了我们对不同行业的五家公司的日常股价价值的方法。我们研究了基于均方误差和预测方向变化统计的结果,作为绩效的衡量标准,以及基于预测波动性的风险衡量标准。IKeywords:股价预测、主成分分析、principlesubspace、协方差、绩效2010 MSC:00-01、99-001。股票价格预测是金融领域最具挑战性的问题之一。成功预测股票价格可以在交易中产生显著的收益。技术交易者的分析基于市场模式*相应的authorEmail地址:mahsa。ghorbani@colostate.edu(Mahsa Ghorbani)本文各部分的初步版本已于2018年3月15日提交给《国际预测杂志》(International journal of forcasting)的预印本中呈现,假设价格在未来会再次出现,因此这些模式可用于预测目的[2]。

藤椅
可人4 在职认证  发表于 2022-6-9 18:41:54
研究表明,盈利收益率、现金流收益率、规模和账面市盈率等基本变量以及利率、预期通货膨胀率和股息等宏观经济因素对预测股票回报有一定的作用[5、6]。文献提供了强有力的证据,表明价格也可以通过过去的价格/回报数据以及其他基本或宏观经济变量进行预测。一些研究发现,短期内收益率具有显著的自相关性。French and Roll find individualsecurities for daily returns的负相关性[7]。其他人发现周和月持有期回报率存在显著的正序列相关性[8]。研究还表明,在几个月或几年的时间范围内,股票收益率存在相关性。Famaand French报告称,对于市场效率测试中常见的每日和每周持有期,自相关性较弱,但对于长期回报,自相关性更强[5]。他们发现,在三到五年的时间间隔内,个别股票和各种投资组合的回报率呈负序列相关。Cutler等人表明,在几个月的时间范围内,回报率呈正相关,而在三到五年的时间范围内,回报率呈负相关[9]。还有一些其他研究也显示了股票收益在多年间隔内的相关性[10,11],所有这些研究都证实了价格/回报值可以从过去的价格/回报值中预测。在本文中,我们描述了一种基于历史价格数据,利用协方差信息预测未来股价值的通用方法。已知数据集的协方差矩阵与classicalmaximum似然估值器(12)或经验协方差(如果观测值的数量与预测值的数量相比足够大)非常接近。当矩阵维数(N)相对于观测数(K)较大时,就会出现问题。

板凳
何人来此 在职认证  发表于 2022-6-9 18:41:57
在这种情况下,上述估计值不可靠。当K小于M时,问题就更糟了,因为矩阵不是正定义的[13]。这一问题在金融领域经常发生,由此产生了一类新的估计量,如收缩估计量。例如,Ledoit和Wolf,将样本协方差缩小到一个缩放的单位矩阵,并提出一个收缩系数分布,该分布将估计协方差矩阵和实际协方差矩阵之间的均方误差最小化【14】。该领域的其他一些研究包括[15、16、17]。在本文的数值评估中,我们有足够的经验数据来生成可靠的经验协方差矩阵,至少足以说明我们方法的有效性。均方误差(MSE)被认为是衡量预测工具性能的合适指标【2,6】,它是实际价格和预测价格之间的平均平方差。给定历史数据,估计未来价格的一种有效方法是简单地使用多元条件平均作为点估计量,因为它使估计的均方误差最小化[18]。然而,由于相关的病态问题,使用该方法的数值结果并不总是可信的。我们的主要目标是提出一种具有类似预测能力的方法,该方法不受此问题的影响。主成分分析(PCA)是一种成熟的降维数学程序,在时间序列预测、模式识别、特征提取、数据压缩和可视化等各个领域有着广泛的应用。在定量金融领域,主成分分析与探索金融时间序列【21】、动态交易策略【22】、金融风险计算【23、22】和统计套利【24】相关。

报纸
何人来此 在职认证  发表于 2022-6-9 18:42:00
在这项工作中,我们使用主成分分析预测股票价格。我们的方法与子空间滤波方法具有相似性。这些方法基于噪声数据空间在信号子空间和噪声子空间上的正交分解。在数据的低秩模型假设和噪声协方差矩阵估计值可用的情况下,这种分解是可能的【25】。这项任务可以基于数据矩阵的修正奇异值分解(SVD)完成【26】。正交分解为帧相关信号和噪声子空间可以通过噪声信号观测矩阵的奇异值分解或等效地通过噪声信号协方差矩阵的特征值分解来执行【25】。我们比较了我们提出的方法在均方误差和方向变化统计方面的性能。方向变化统计计算与方向变化相关的实际值和预测值的正确匹配数【27】。它是一种重要的业绩评估指标,因为预测价格走势在某些市场策略中非常重要。我们感兴趣的另一个重要参数是标准差,这是投资组合管理中关键的基本风险度量之一[28]。标准差是对波动性的一种统计度量,投资者常用它来衡量股票或投资组合的风险。如上所述,在本文中,我们重点从每日历史价格数据预测股票价格。在第2节中,我们介绍了我们的技术方法,特别是使用协方差信息的估计技术。在第3节中,我们描述了我们处理数据和根据经验数据估计方差矩阵的方法,包括数据归一化。我们还演示了我们的方法的性能。2、理论方法学2.1。

地板
kedemingshi 在职认证  发表于 2022-6-9 18:42:03
估计技术在本节中,我们介绍了一种新的计算方法,用于使用协方差信息估计未来股价值。如果有足够的经验数据可用,经验方差可以用作协方差矩阵的估计值,或者我们可以使用类似于上一节中介绍的技术。假设我们得到了M天的股票价格值。总体目标是预测下一个M+1到N个数据点,代表下一个N年内公司股票价格- M个交易日,使用上一个连续M天的观察值。引入N的原因将在下文中明确。2.1.1. Gauss-Bayes或z的条件估计,假设x是长度为N的随机向量≤ N并假设向量x的前M个数据点代表过去M个连续交易日内公司股票的日终价格。多变量向量x和可以用x=hy zi的形式进行划分,(1)让随机向量y代表前M个数据点,z代表下一个N的价格- 未来M天。我们希望从y估计z。随机向量x的协方差矩阵可以写成∑xx=∑y y∑y z∑zy∑zz, (2) 其中,∑y是y的协方差,∑zz是z的协方差。假设y和z是联合正态分布,已知x=[y,z]的先验分布,则给定y的z的贝叶斯后验分布由bzz | y=∑zy∑给出-1y yyb∑z | y=∑zz- ∑zy∑-1y y∑y z。(3)表示给定y的z的条件协方差的b∑z | y矩阵也被称为∑y yin∑xx的舒尔补。请注意,后验协方差并不取决于y的具体实现。价格预测的高斯-贝叶斯点估计值,即条件平均值bzz | y,使估计值的均方误差最小化【18】。

7
可人4 在职认证  发表于 2022-6-9 18:42:06
结果表明,对于特定观测y,条件协方差的逆是与从y估计z相关的Fisher信息矩阵,因此b∑z |是z的任何无偏估计器的误差协方差矩阵的下界。卡尔曼滤波中出现了相同的方程组。Kalmans自己认为这个过程是一个完全确定性的操作,并不依赖于假设正态性。虽然点估计量bzz | yis在均方误差方面是最优的,但在实践中,该方法涉及到数值复杂性:矩阵∑y yis通常没有良好的条件,因此∑的数值计算-1你不能总是被信任。为了克服这个问题,我们提出了一种更好的条件估计,其行为接近高斯-贝叶斯。2.1.2. 低维主成分分析(PCA)中的主成分和估计是一种成熟的数据降维数学方法,在各个领域都有广泛的应用。在这项工作中,我们考虑它在预测股票价格中的应用。考虑∑xx的奇异值分解(SVD)∑xx=V SV,(4),其中S是与x维数相同的对角矩阵,具有降序的非负对角元素,V是酉矩阵(V VT=in)。S的对角元素是∑xx的特征值。通常,前几个特征值占所有特征值总和的大部分。“大”特征值称为主特征值。相应的特征向量称为主分量。设L<N,使得S中的前L个特征值占特征值总和的大部分(比如85%或更多)。设Vl为酉矩阵V的第一列。然后,随机向量x近似等于V:x的前L列的线性组合≈ VLα,(5),其中α是长度为L的随机向量。

8
能者818 在职认证  发表于 2022-6-9 18:42:10
由于L与N相比是一个较小的数字,方程式(5)表明,一个维数低于N的“噪音”较小的子空间可以代表大部分信息。投影到这个原则子空间可以解决∑y y的病态问题。其思想是,在表示∑xx时不包括所有特征值(其大小变化很大),而是使用一个只包括“大”特征值的子集,因此大大缩小了特征值的范围。在信号子空间滤波方法中也实现了相同的概念,该方法基于噪声语音观测空间到信号子空间和噪声子空间的正交分解[25]。让VM、Lbe为V的前M行和前L列。我们有y=VM,Lα+噪声。(6) 从数学上讲,将噪声观测向量y分解到主子空间可以写成滤波运算,形式为w=Gy,(7),其中G由G=(VM,LVM,L)给出-1VM,L.(8)向量w实际上是y在子空间上的正交投影的坐标,等于VM,L的范围。我们也可以将w视为基于最小二乘法的α估计。在(3)中用w代替y可以得到更好的条件方程组:bzz | w=∑zw∑-1wwwb∑z | w=∑zz- ∑zw∑-1ww∑wz,(9),因为∑ww的条件数远低于∑y的条件数,我们将在后面演示。在(9)中,我们有∑zw=Ehzwi=∑zyG,(10)和∑ww=Ehwwi=G∑y yG。(11) 如果基于(9)估计的z的后验分布与(3)估计的分布具有相似的行为,则可以认为它是高斯-贝叶斯方法的一个很好的替代方法。我们的模拟表明,这确实是一种情况,我们将在第3.2.1.3节中介绍。

9
可人4 在职认证  发表于 2022-6-9 18:42:13
无条件估计也许z最简单的估计量只是使用(无条件)均值及其相关协方差:bzUncon=E[z]b∑unco=∑zz,(12)其中bzUncon是(无条件)均值,b∑uncois是z的样本协方差。虽然该估计量忽略了y中的历史价格,但它对于比较是有用的,如下文第2.3节所示。2.2. 均方误差为了比较上述方法的性能,我们评估了实际值和估计值之间的均方误差预期值。估计值^z的均方误差由以下公式得出:MSE=Ehkz- ^zki=Ehkzki+Ehk^zki- 2 HKZ^zki。(13) MSE可以用(2)中的协方差矩阵表示,方法是替换适当形式的^z。在无条件的情况下,当无条件平均值用作未来值的估计值时,点估计值为^z=E【z】。通过在(13)中替换^z,MSE将变为OMEMSEUNC=跟踪(b∑Unc)。(14) 在Gauss-Bayes方法中,点估计量为bz=∑zy∑-1y yy,导致msegb=跟踪(b∑Unc)- 跟踪(∑zy(∑zy∑)-1y y))。(15) 最后,在使用主成分的降维方法中,点估计量可以表示为bz=Cy,其中C=∑zw∑-1wwG。然后,均方误差变为:MSERD=迹线(b∑Unc)+迹线(C∑y yC)- 2trace(zyC)。(16) 或者,可以将估计量的均方误差bz写入估计量的方差加上其平方偏差。给定x的条件写为asMSEbz | z=Ehkz- ^zk | zi=迹线(∑bz | z)+Eh^z | zi- z. (17) 第一项称为方差,第二项称为平方偏差。所有观测值的MSE期望值为实际(无条件)MSE,可通过取(17)两侧的期望值来计算:MSE=EhEhkz- ^zk | zii=迹线(E∑bz | z)+EEh^z | zi- z.

10
nandehutu2022 在职认证  发表于 2022-6-9 18:42:16
(18) 结果表明,高斯-贝叶斯估计是无偏的,这意味着第二项是0,而无条件估计和所提出的降维方法是有偏估计,我们将在下面介绍。我们可以如下计算偏差。在Gauss-Bayes中,通过将估计量写为bz=Dy,其中D=∑zy∑-1y y,偏差为:BiasGB=EEhE[z | y]| zi- z=Ehkz公司- zki=0。(19) 如上所述,高斯-贝叶斯估计是无偏的,事实上,该方法中的协方差矩阵为所有无偏估计提供了均方误差的下限。无条件情况下:BiasUnc=E鄂河【z】|子- z=E埃齐- z= 跟踪(∑zz)。(20) 在这种情况下,偏差等于MSE值,这意味着估计量的方差为零。这是因为在这种情况下,我们对不同的观察结果有相同的估计。在降维法中,C项中的偏差计算为:BiasRD=ECEhy | zi- z=traceh(一)- CR)∑zz(I- CR)i(21),其中R=∑y z∑-1zz。2.3. 数值说明为了说明到目前为止的讨论,我们在接下来的10天内实施了三种不同的估计技术(第M+1天到第N天,其中第N天- M=10)。图1显示了我们的股票预测示例。假设我们得到了过去20天的价格值M=20,并且我们希望使用这些值预测未来10个工作日的价格,从M+1日到N=30日。在我们的降维技术中,对于相对较小的L,我们可以得到预测值的相对滑动图,对于较大的L,可以得到与高斯-贝叶斯几乎相同的图。如前所述,均方误差(MSE)是一种常见且适当的性能度量。前几节介绍了每种情况下均方误差的计算公式。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 10:07