楼主: 量化老KK
229 1

[程序化交易] 策略优化——样本外递进检验初探 [分享]

  • 0关注
  • 4粉丝

大专生

36%

还不是VIP/贵宾

-

威望
0
论坛币
20 个
通用积分
4.1011
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
433 点
帖子
19
精华
0
在线时间
35 小时
注册时间
2019-11-20
最后登录
2020-9-24

量化老KK 发表于 2020-1-7 15:11:44 |显示全部楼层
一、概念简介

样本外递进检验是严格意义上的样本外检验。这种优化算法,使用一段历史数据进行参数优化,选择参数,应用参数到优化样本外的检验样本中。不断推进样本递进优化,并提取检验样本的测试结果形成测试报告。

样本外递进检验比起单纯的历史测试,能更真实的反应参数选取对未来绩效的影响。参数优化的重心更加偏向于如何确定参数选取的方法,而不是简单的历史绩效的比较。

二、参数说明

1、单位样本

1.png


数据样本可以按照Bar或天、周等自然时间设置。按Bar拆分时,会遍历策略单元中起始时间最早的数据源作为基准数据源,对基准数据源做Bar设置拆分,其他数据源会依据基准数据源拆分的结果,按时间对齐原则做相应拆分。

由于多数据源时间段不匹配,拆分时可能会出现部分数据单元为空,或尾部数据单元数据较多的情况。

按自然时间拆分时,会选取数据源开始最早时间和最晚时间(时间可以不在同一数据源),自然时间拆分会在此时间区间做均匀拆分,因为多数据源时间段不匹配,拆分时同样会出现部分数据单元为空,但不会出现尾部单元臃肿情况。

单位样本数设置是为样本拆分的基础数据单元做准备。

2、优化样本

Ⅰ.优化份数

优化样本份数在不设置开始时间或设置的开始时间无效时生效。优化份数表示所占的基础数据单元的数量,从数据的起始部分开始向后递进。优化份数需大于等于1。

Ⅱ.优化累计上限

优化样本默认是从原始数据起始部分开始一直向后递进累计,设置了有效上限数时(上限数值大于优化份数),则会从优化样本的结束时间开始,向前覆盖上限数值的基础单元数量(不超过原始数据起始时间),以此时间段作为此段优化报告的起止时间。

Ⅲ.开始时间设置

若启用开始时间设置,并设置了有效时间(时间在原始数据范围内),则会根据原始数据起始时间至该有效时间(不包含该时间点)的区间中所包含的基础数据单元数量作为优化份数数值,以替换原始设置优化份数数值,进行优化样本的递进测试。

并且,当设置的时间处于基础数据单元的中间段时,如:

设置时间为 2019.09.13,而数据时按照1 月做拆分,则9月份的数据会被拆为两份基础数据单元,分别为 2019.09.01-2019.09.12 和 2019.09.13-2019.09.30。

若是按100 Bar拆分,若设置时间T处于基准数据源的第130根Bar,处于基础数据单元101-200中,则此时拆分结果为 101-130,130-230 ……

3、检验样本

Ⅰ.检验份数

检验份数表示参与到汇总结果中的每段基础数据单元数量,从第一份优化样本的结束时间开始,向后递进,每段会生成一份截取报告,每段截取报告的时间互不交叉。检验份数需大于等于1。

Ⅱ.检验累计上限

检验累计上限的原理同优化累计上限。

Ⅲ.间隔份数

间隔份数表示每段的截取报告的开始时间和优化报告的结束时间所间隔的基础单元的数量,间隔份数需大于等于0。

4、优化原理

Ⅰ.递进原理

递进优化原理如下图:

2.png


Ⅱ.信号截取

截取报告是通过将该段检验报告的信号中检验份数时间段内的信号截取而生成的报告,截取后需要对被截取的信号做前端强开和尾端持仓强平的信号补齐操作。

强平信号是指在检验报告结束时间点若有持仓,会补充持仓强平信号,递进优化强平信号不计手续费,但此段的强平数量会被记录,用于下段的强开信号手续费计算处理。强平价格为结束时间的收盘价。

强开信号是指若检验报告中未被截取的信号集中,存在未处理的持仓,则会统计该持仓的原始开仓市值(过滤换仓信号影响),按照该持仓数量,在截取报告的起始时间补齐强开信号。强开信号的盈亏会被记录,在报告结果中被抹平。强开信号的手续费会减去前段截取报告中的强平数量后,余值大于0时,按余值计算本次强开手续费。



stata SPSS
renwl 发表于 2020-1-9 14:55:22 |显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2020-10-1 09:17