楼主: mingdashike22
1149 14

[量化金融] 投资组合的最佳股票推荐策略 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-11 12:55:05
本研究中使用的数据集是指库存稳步增长和印度经济扩张的时期。由于在每项任务[6]中报告的正则化成功,L2正则化是在通过快速梯度下降进行训练的同时对可训练参数进行的。这意味着系数的平方和被加到最终损失函数中。因此,对系数进行训练的双重目标是获得正确的预测和保持系数较小。通过建议的正则化rankregression模型获得的结果与秩回归模型的结果分开报告。最后,将所提出的模型与简单回归模型、岭回归模型和天真模型进行了比较。简单回归模型和岭回归模型使用相同的输入特征来训练输入和季度回报之间的线性关系,就像所提出的模型一样。这些模型的不同之处仅在于在训练集上学习参数的方式。简单回归和岭回归模型使用随机梯度下降(SGD)方法来训练方程的参数。SGDmethod适用于大型数据集,甚至可以扩展到非常大的数据集。此外,对所有模型使用相同的SGD方法,验证了图1中使用的批量集中技术的优势:拟议算法,拟议算法的伪代码用于通过梯度下降(GD)训练模型参数。提出的模型。这个天真的模型根据上一季度的回报率对公司进行排名。上一季度表现最好的公司预计也会在本季度表现最好。

12
kedemingshi 在职认证  发表于 2022-6-11 12:55:08
这是受维纳过程(Wienerprocess)或基于随机游走的股票价格建模的启发。在这五个模型上进行了实验,以确定其中最好的模型。表1描述了这些模型,忽略了天真的模型。在每个实验中,一个模型根据上一季度的信息进行训练,并用于对下一季度的所有上市股票进行排名。对于用于培训的每种股票,建议的模型都会产生预期的相对回报。这种相对回报最终决定了该股票在所有其他股票中的排名或表现。这里,需要为497家公司或708家公司组成的每个数据集学习25个参数。这意味着这些参数应同时将所有497或708家公司的误差降至最低。这必须在交叉验证实验期间重复多次,稍后将对此进行解释。因此,数据集很大,计算参数需要大量计算。因此,随机梯度下降法用于参数训练。这与用于学习深层神经网络的方法相同,在这里,它被更复杂地称为反向传播算法(back-propagationalgorithm)。计算每个库存的误差,并更新参数以将误差降至最低。直到达到停止标准为止。当误差达到给定条件下的最小值时,停止标准停止迭代过程。条件是,在停止之前,当前最小误差值在过去三万次迭代中没有进一步减小。

13
能者818 在职认证  发表于 2022-6-11 12:55:11
迭代的最大数量达到了80万次,尽管迭代在这个数量之前就停止了。这些算法被编码到python 3中进行实验。Pytorch是一个python深度学习模块,用于学习回归参数。接下来,我们提供有关数据集、验证策略和评估指标的信息。3.2.1数据集描述从Thomson ReutersEikon工具中提取两个数据集进行实验。第一组数据包括在BSE500指数上上市的497家公司。第二组数据包括在印度国家证券交易所(NSE)交易的708家公司。这些公司的信息每季度提取7年。所考虑的期限自2011年1-3月季度开始,至2017年10-12月季度结束。因此,总的来说,这些数据集包含了这28个季度公司的信息和目标价值。3.2.2评估指标上述模型用于按预计下季度回报率对股票进行排名。模型根据五个指标进行比较:1。)AP@100:平均精度指标fortop 100建议(AP@100).该度量由以下内容给出:1001)().(1001100@kkrelkPAP(3) 式中,P(k)是将“最顶尖的k家公司的正确推荐数量”除以“k”后得到的rel(k)\'是一个指标函数,当推荐值位于前k位时为1,否则为0。这项措施之所以被采纳,是因为主要关注的是准确地按照正确的顺序推荐顶级公司。表1:不同型号的型号说明。特征归一化是指输入特征的归一化。

14
可人4 在职认证  发表于 2022-6-11 12:55:15
目标值归一化是指使用训练数据目标值的平均值和标准偏差对目标值进行归一化。因此,训练数据目标值均值和标准偏差分别等于0和1。但是,测试数据的目标值平均值和标准偏差分别不完全等于0和1。”“o”和“a”分别指一批的模型输出值和实际值的平均值。”pi’是回归方程的系数值。模型预处理步骤最终错误函数培训程序示例SGDFeature归一化+目标值归一化2) (IIAO参数在每次迭代(仅包含1个样本)后通过SGD更新。简单SGD+L2特征归一化+目标值归一化2221)(III参数在每次迭代后通过SGD更新,每次迭代仅包含1个样本。秩-回归特征归一化2) )()((aaooiiParameters在每次迭代后通过SGD更新,包括每个季度内的所有样本。秩回归+L2特征归一化 2221))()((IIIPaaoopParameters在每个季度的所有样本组成的每次迭代后通过SGD更新。2)前20名:按模型建议平均投资前20名股票所产生的实际回报3。)前50名:按模型建议平均投资前50名股票所产生的实际回报4。)无风险20:计算具有低风险和高回报的非支配解(最优解)。无风险20只股票的回报率排在前20名股票的风险最小,回报率最高。过去收益的标准偏差被用作风险度量。

15
nandehutu2022 在职认证  发表于 2022-6-11 12:55:17
在每个战线内,股票按照较高的回报值进行排序。5)无风险50:与无风险20类似,无风险50给出了风险最低、回报最高的前50名股票的平均回报。3.2.3验证策略通过扩展交叉验证在不同模型上进行实验。交叉验证是通过将数据组织到滚动窗口中来完成的,在滚动窗口中,对一定数量的连续季度进行培训,然后将下一季度用于测试目的。在3个不同的实验中,用于训练的连续季度数分别为10、15和20个。因此,在分别对应于10、15和20个训练时间戳/训练季度的实验的18、13和8对训练测试数据集上验证了总体结果。这里,18指的是通过将窗从前11个季度滚动到总共28个季度的最后11个季度而获得的18个窗。同样,也可以破译其他数字13和8。表2-7给出了每个交叉验证集的平均结果。结果实验的总体结果证明了所提出模型的优越性。表2,3使用10个季度学习参数时的显示结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 19:51