楼主: nandehutu2022
755 17

[量化金融] 利用字符串不变量预测搜索最优参数 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-25 10:07:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Using String Invariants for Prediction Searching for Optimal Parameters》
---
作者:
Marek Bundzel, Tomas Kasanicky, Richard Pincak
---
最新提交年份:
2016
---
英文摘要:
  We have developed a novel prediction method based on string invariants. The method does not require learning but a small set of parameters must be set to achieve optimal performance. We have implemented an evolutionary algorithm for the parametric optimization. We have tested the performance of the method on artificial and real world data and compared the performance to statistical methods and to a number of artificial intelligence methods. We have used data and the results of a prediction competition as a benchmark. The results show that the method performs well in single step prediction but the methods performance for multiple step prediction needs to be improved. The method works well for a wide range of parameters.
---
中文摘要:
我们开发了一种基于字符串不变量的新预测方法。该方法不需要学习,但必须设置一小组参数以实现最佳性能。我们实现了一种用于参数优化的进化算法。我们在人工和真实数据上测试了该方法的性能,并将其与统计方法和一些人工智能方法进行了比较。我们使用数据和预测比赛的结果作为基准。结果表明,该方法在单步预测中表现良好,但在多步预测中的性能有待提高。该方法适用于范围广泛的参数。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:字符串 Quantitative Applications Mathematical Optimization

沙发
mingdashike22 在职认证  发表于 2022-5-25 10:07:31
1使用字符串不变量预测搜索最佳参数Marek Bundzel1、TomásKasanick'y2、Richard Pinckak3 1,斯洛伐克共和国科希策技术大学电气工程与信息学院控制论与人工智能系,2斯洛伐克科学院信息研究所,3实验物理研究所,斯洛伐克科学院。1马雷克。bundzel@tuke.sk,则,2kasanicky@neuron.tuke.sk3.pincak@saske.skAbstract-我们开发了一种基于字符串不变量的新预测方法。该方法不需要学习,但必须设置一小组参数以实现最佳性能。我们实现了一种用于参数优化的进化算法。我们在人工和真实数据上测试了该方法的性能,并将其与统计方法和一些人工智能方法进行了比较。我们使用数据和预测比赛的结果作为基准。结果表明,该方法在单步预测中表现良好,但在多步预测中的性能有待提高。该方法适用于范围广泛的参数。关键词-弦论和弦不变量、进化优化、人工智能I.简介弦论是在过去25年中发展起来的,它在物理学家中得到了高度的普及和尊重[1]。我们开发的预测模型将现代物理学的思想转移到了时间序列预测领域。物理统计观点证明了描述多身体效应占主导地位的系统的能力。该方法的预期应用领域是经济物理学,但该模型肯定不限于经济应用。

藤椅
何人来此 在职认证  发表于 2022-5-25 10:07:34
自底向上的方法可能难以跟踪复杂经济系统的行为,其中自治模型会遇到内在的可变性。主要动机来自实际的物理概念[2,3]。我们将这种新方法命名为基于字符串不变量的预测模型(PMBSI)。PMBSI基于【4】中描述的方法,并扩展了之前的工作。在【5】中,我们进行了对比实验分析,旨在确定PMBSI的优势和劣势,并将其性能与支持向量机(SVM)进行比较。PMBSI还代表了将弦理论应用于时间序列预测领域的首次尝试之一,而不仅仅是在高能物理领域。我们将在下面简要介绍预测模型。PMBSI需要设置多个参数以实现最佳性能。我们实现了一种进化算法来寻找最优参数。下面描述实现。我们展示了之前获得的结果,并将其与进化优化参数的结果进行了比较。我们还对2008年时间序列预测竞赛中使用的111个时间序列进行了PMBSI测试。因此,我们可以将其性能与广泛的方法进行比较。二、最先进的线性方法通常工作良好,可以为手头的任务提供足够的近似值,并且在数学上和实践上都很方便。然而,现实生活中的生成过程往往是非线性的。因此,基于不同方法创建了大量非线性预测模型(例如,GARCH[6]、ARCH[7]、ARMA[8]、ARIMA[9]等)。目前,可能最常用的方法是基于计算智能的。

板凳
能者818 在职认证  发表于 2022-5-25 10:07:39
许多研究文章将人工神经网络(ANN)和支持向量机(SVM)相互比较,并与其他更传统的非线性统计方法进行比较。Tay2和Cao【10】研究了支持向量机在金融时间序列预测中的可行性,并将其与多层反向传播神经网络(BPNN)进行了比较。他们表明SVM优于BP神经网络。Kamruzzaman和Sarker【11】使用三种基于ANN的模型对货币汇率进行建模和预测,并与ARIMA模型进行比较。结果表明,所有基于人工神经网络的模型均优于ARIMA模型。Chen等人[12]以自回归模型为基准,比较了SVM和BPNN在预测亚洲六大股市方面的表现。同样,SVM和BPNN都优于传统模型。SVM实现了结构风险最小化,这是一种用于从有限训练数据集学习的模型选择归纳原则。因此,SVM通常被选为比较其他非线性模型的基准。许多受自然启发的预测方法已经过测试。Egroglu【13】将粒子群优化应用于模糊序列预测。LIU等人【14,15】应用ANFIS和进化优化预测TAIEX。迄今为止,没有一种非线性黑箱方法比其他方法具有显著的性能优势III.基于字符串不变量的预测模型() 转换如下    (1) 其中h表示() 和(+h) ,则, 是时间序列元素的索引。对于财务数据,例如平均货币汇率的报价序列,此操作将原始时间序列转换为一系列回报。

报纸
能者818 在职认证  发表于 2022-5-25 10:07:42
使用弦理论,让我们首先定义1-端点开弦映射    (2) 其中上标(1)表示端点的数量,以及 字符串的长度(字符串大小)。  是正整数。变量h可解释为沿字符串大小限制的额外尺寸延伸的变量. 转换的自然结果,公式(2),是边界条件的实现(3) 这适用于任何.  为了增强罕见事件的影响,引入了幂律Q变形模型   (4) 1-终点字符串定义了原点,它反映了  在天平上. 长期趋势的存在通过固定 在. 具有两个端点的开放串通过非线性映射引入,该映射结合了关于 在两个连续段      (5) 建议地图包括Dirichlet类型的边界条件完全(6) 特别是 包含有关以下行为差异的信息:在三个引号处  . 这个 针对不同符号的趋势发生,而 指示符号的匹配。现在我们定义了字符串不变量——在转换过程中不变的东西。我们将在数据中找到不变量,并利用它们预测未来的值。【16】中描述了一项旨在发现金融市场不变状态的类似研究。让我们3引入一个正整数 表示提前多少步的预测规模 存在预测值。

地板
mingdashike22 在职认证  发表于 2022-5-25 10:07:45
让我们引入一个辅助正整数 和一个条件 (7) 时间序列数据的非线性字符串映射的威力将被用来建立一个类似于【17、18、19】中所述的预测模型。我们提出了一种两端点混合管柱模型,其中一根管柱连续变形为另一根管柱。有关此方法的更多详细信息,请参阅我们上一篇论文的附录【5】。不变量族是使用参数化编写的                       (8) 在哪里,  是可以称为同伦参数的变量,  是实值参数,权重 以双峰单参数形式选择    和(9) 以上不是权重参数的唯一或理想设置。   用辅助变量表示                              (10) 因此,预期的预测表单读取          (11) 在哪里  , ( ). 推导基于不变性    (12) 如果 (13) 模型的自由参数为,  ,  ,    和.  这些必须在进化优化阶段设置。PMBSI不需要传统意义上的学习。PMBSI要求正在处理的时间序列为非负。否则,将不定义预测(NaN)。

7
kedemingshi 在职认证  发表于 2022-5-25 10:07:48
尽管如此,PMBSI有时返回NaN值。通过将NaN预测替换为 (原始预测)和记录的最后一个有效预测.  四、 无PMBSI参数的进化优化图1显示了平均绝对误差(MAE,公式(14))对ls和Q设置的依赖性。我们用金融时间序列和5步超前预测进行了实验,如【6】所述。η1、η2的值设置为0。实验表明,尽管PMBSI在较宽的设置范围内表现相对较好,但在参数空间中存在许多局部极小值。下一个合乎逻辑的步骤是找到一种方法,将所有PMBSI的自由参数设置为最佳值。图1 PMBSI相对于参数设置的性能【6】。红点表示全局最小值。我们选择了遗传算法来自动寻找ls,η1,η2,Q的最优值。这个决定是合理的搜索空间的性质与许多局部极小值。遗传算法执行并行搜索,因此能够避开局部极小值。解(染色体)是一组实值参数,即[ls,η1,η2,Q]。对于每个时间序列,我们将数据集分为两部分,即训练集和验证集。该训练集用于测试给定参数下PMBSI的性能。训练集上的MAE对应于特定解的适应度。到目前为止,我们已经解释了个体的编码和适应度函数的计算。我们对参数设置了约束,以期望限制搜索空间。初始种群是从给定的区间随机生成的。然后计算初始种群的适应度。

8
kedemingshi 在职认证  发表于 2022-5-25 10:07:51
使用锦标赛选择。在两个独立的N元锦标赛中选择了两个父母个体。使用交叉和变异算子产生了一个后代。检查子代的5号染色体是否满足约束条件,如果不满足约束条件,则修复染色体,以便将越界值设置为给定参数的相应最大值或最小值。计算后代的适应度。将新的个体插入代表新一代的列表中,并重复该过程,直到列表中的个体数量与实际世代相同。然后,一定数量的实际世代中最适者生存的个体取代了新世代中最弱的个体(精英主义),新世代成为了实际世代。重复该过程,直到达到停止标准。停止的标准是当最合适的个体的适应性没有改善(没有进步)时,随后的几代人。我们已经实现了真正的价值交叉。交叉导致个体介于父母之间,但不在他们的平均水平上。让我们有家长个人 和 和一个向量  与父代长度相同,由间隔中的随机数组成0,1. 后代 生产日期:     其中。*表示两个向量的成员乘法。然后使用用户集概率变异算子:   哪里 是突变率,在进化过程中逐渐均匀地降低 是一个向量,其长度与由区间中的随机数组成的个体向量长度相同-1,1.

9
mingdashike22 在职认证  发表于 2022-5-25 10:07:55
每代后突变率逐渐降低,无进展。如果未达到停止标准且突变率达到0, 已重置为其初始值。突变适用于每一个新个体。通过反复试验,我们发现遗传算法(GA)的参数运行良好。在给定的设置下,GA可以在合理的时间内找到最优解。然后,我们对每个PMBSI优化使用相同的GA参数,而不管给定的时间序列:1。没有进展终止GA的世代数设置为50。2、人口规模设定为20人。3.1%最健康的父母(精英)存活下来。4、锦标赛规模设置为5。5.初始值设置为0.5。五、 实验我们进行的实验有三个目标:1。为了验证我们的GA实现可靠地找到最佳PMBSI设置,2。比较有无GA优化参数和3的PMBSI性能。将遗传算法优化的PMBSI与其他方法进行比较。我们使用了人工和真实世界的数据。除了我们在[6]的实验中使用的数据(1295天的正弦波和专有每日财务数据),我们还使用了“神经网络和计算智能NN5预测竞赛”的数据和结果[20]发表于2008年国际预测研讨会,ISF\'07。因此,我们可以在111个真实时间序列上评估PMBSI,并将其性能与多种方法进行比较。所有111个时间序列包含775个值,其中最后56个值是需要预测的。

10
nandehutu2022 在职认证  发表于 2022-5-25 10:07:57
我们使用了两个错误度量;MAE和对称平均绝对百分比误差(SMAPE),定义为: (14) (15) 其中n是样本数,At是实际值,Ft是预测值。每个时间序列分为三个子集:培训、评估和验证数据。保持数据的时间顺序;最新的数据用于训练,最新的数据用于评估特定模型在给定参数设置下的性能。选择评估集上表现最好的模型(就MAE而言),并对模型优化过程中从未使用过的验证数据(最新)进行预测。在我们之前的工作【6】中,我们通过尝试从给定范围内以足够的采样率采样的参数ls和Q(η1,η2=0)的所有组合,找到了最佳PMBSI参数。这个缓慢的过程使我们能够将GA优化参数与我们认为的最佳参数进行比较。我们构建了比较支持向量机模型,以便时间序列的当前值和一定数量的连续过去值构成模型的输入。输入向量是一个长度为ltw的时间窗口,它等效于字符串映射ls的长度。A、 在人工时间序列上的实验结果我们使用了由51个规则间隔样本采样的单周期正弦曲线。这段时间的正半部分用于培训和评估。负一半用于验证。对于PMBSI,通过添加一个正常数,时间序列移到零以上。然后从预测中减去常数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 23:22