楼主: mingdashike22
1664 44

[量化金融] 用超高频数据估计Ornstein-Uhlenbeck过程 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-11 04:41:43
(65)第一次通过时间从▄a到▄b和从▄b到▄a的差异分别为Var▄T▄a→b=φ(-b)- φ(-b)+φ(-a)- (φ(-a)),var▄T▄b→a=(φ(¢a))- φ(~a)+φ(~b)-φ(¢b),(66)其中φ(z)由(64)和φ(z)给出=∞Xk=1√2zkk!Γkψk- ψ (1). (67)交易周期持续时间的方差为VaRT=w(a)- w(¢b)- w(a)+w(b),(68),其中w(z)=∞Xk=1√2zkk!Γk!-∞Xk=1-√2zkk!Γk!,w(z)=∞Xk=1√2z2公里-1(2k- 1)!Γ2公里- 1.ψ2公里- 1..(69)通过将(65)和(68)应用于(55),我们得到了单位时间预期收益和单位时间收益方差的明确公式。3.3优化问题我们继续在无量纲系统中运行。对于给定的交易成本c和单位时间的最大允许方差η,我们通过优化问题maxa,bZM(a,b,c)找到最佳进入信号a和退出信号b,从而ZV(a,b,c)≤ §η,§b≤ a,▄a≥ 0,(70)式中,单位时间预期收益率ZM(a,b,c)和单位时间收益率方差ZV(a,b,c)由(60)给出。该公式对应于我们做空A股和0.00000.00250.00500.00750.01000.01250e+00 1e股的策略-05 2e-05 3e-05最大方差最优平均利润率参数correctincorrectprofictrealassumedefficient front of Pairs Trading strategy图2:基于正确指定参数u=1、τ=10、σ=10的优化问题平均方差模型的有效边界-4以及不正确的参数τ=100。多头股票B.反向头寸策略的制定,信号a=-a和▄b=-双对称。无论如何,这是一个非线性约束优化问题,我们用数值方法来解决。让我们表示▄a*最佳进入信号b*最佳退出信号和▄Z*M无量纲系统中的最佳平均值。我们的数值结果表明,最佳出口信号为b*=-a*.

22
何人来此 在职认证  发表于 2022-6-11 04:41:46
正如Bertram(2010)所示,在预期收益无限制最大化和夏普比率最大化的情况下,这与最佳退出信号的行为完全相同。这也意味着交易周期中允许长/空头和空头/多头头寸的策略的等待部分减少到零,因为退出水平等于具有相反头寸的策略的进入水平,即▄b*= -a*= a*. 最佳策略建议在信号灯下,简单地将A股的头寸从空头切换到多头,并将B股的头寸从多头切换到空头-a*信号a处的viceversa*.3.4有偏估计的影响下一步,我们研究τ和σ有偏估计的影响。由于优化问题(70)本身是在无量纲系统中制定的,因此它不受Ornstein–Uhlenbeck工艺参数值的影响。然而,重新参数化(56)受到影响。这意味着基于原始参数化中的值c和η的优化问题▄c和▄η的输入可能会有偏差。根据(58),当τ和σ的比率有偏差时,交易成本c有偏差。与(60)中的方差类似,允许的最大方差|η被重新参数化为|η=2η/σ,因此当σ有偏差时,会有偏差。在原始参数化中,当所产生的最佳信号A和b转换回A和b时,也会出现偏差。根据(58),当τ和σ的比率有偏差时,入口水平a和出口水平b有偏差。当τ或σ根据(60)有偏差时,最佳平均单位时间zm也有偏差。总的来说,τ和σ的偏差估计会影响最大方差约束、最优预期收益和最优进入和退出信号。当σ被正确规定,但τ被认为比实际值高10倍时,我们说明了最佳预期值的偏差。

23
nandehutu2022 在职认证  发表于 2022-6-11 04:41:49
在这种情况下,最大方差约束是无偏的。图2显示了基于正确指定和有偏差参数的优化问题的均值-方差模型的有效边界。我们可以看到,基于不正确指定参数τ的优化问题高估了最佳平均利润。它还发现次优的进入和退出信号,导致实际平均利润比基于正确参数的最佳平均利润低得多。-0.480-0.478-0.476-0.474-0.47210:00 11:00 12:00 13:00 14:00 15:00 16:00 Timelog BP/RDS价格差价-2018年2月9日的一对-0.432-0.428-0.424-0.42010:00 11:00 12:00 13:00 14:00 15:00 16:00 Timelog BP/RDS价格差价-2018年5月24日的一对图3:2018年2月9日类似于Ornstein-Uhlenbeck过程和2018年5月24日类似于Wiener过程的一对BP/RDS的价差。4对大型石油公司的应用我们分析了从每日TAQ数据库获得的纽约证券交易所(NYSE)交易的7只大型石油股的高频数据。雪佛龙(CVX)、菲利普斯66(PSX)和埃克森美孚(XOM)公司的股票主要在纽约证券交易所上市,而英国石油(BP)、埃尼(E)、荷兰皇家壳牌(RDS-A)和道达尔(TOT)公司的股票主要在其他一些交易所上市,仅在纽约证券交易所第二上市。由于所有7家公司都属于同一行业,并且都受到原油价格的影响,因此可以预期它们的股价会有一定程度的共同变动。被考虑的7个stockscan总共形成21对可能的组合。我们分析了2015年1月2日至2018年6月29日的880个交易日。我们的交易策略利用了第2节和第3节的结果。首先,我们分析历史日内数据。我们在每个考虑的日子分别估计每个考虑的空气的Ornstein–Uhlenbeck过程的参数。

24
大多数88 在职认证  发表于 2022-6-11 04:41:52
一些天表现出强烈的平均回归,表明奥恩斯坦-乌伦贝克过程具有高速的回归,如图3的上图所示,而另一些天表现出随机游走行为,表明维纳过程,如图3的下图所示。具有高逆转速度和高波动性的日子为盈利提供了更多机会。其次,我们利用时间序列模型来捕捉每日参数值的时变性质。这使我们能够预测未来的参数值。第三,假设Ornstein–Uhlenbeck过程具有特定参数,我们会找到最佳的进入和退出信号,以及给定对在给定日期的预期利润和利润方差。根据平均利润及其方差的值,我们决定是否在给定的日期交易给定的一对。如果决策是积极的,那么交易将由最优的进入和退出信号控制。4.1数据清理和数字问题谨慎的数据清理是高频数据分析的最重要方面之一。我们对Barndorff-Nielsen等人(2009)的NYSE TAQ数据库使用了标准数据清理程序,并进行了一些轻微的修改。我们的程序包括以下步骤。1、保留来自单一交易所的分录。删除其他条目。这一步骤符合Barndorff-Nielsen等人(2009)的P3规则。2、交易所开放时,删除窗口外所有有时间戳的交易。纽约证券交易所的正常交易时间为东部时区上午9:30至下午4:00。这一步骤对应于Barndorff-Nielsen等人(2009)的P1规则。3、删除交易已更正的分录。对于纽约证券交易所TAQ数据库,修正后的交易由修正指标“CORR”表示,而非0。

25
大多数88 在职认证  发表于 2022-6-11 04:41:56
该步骤删除已更正、更改或表示为取消或错误的交易,并符合Barndor Off-Nielsen等人(2009)的T1规则。4、删除交易异常分录。对于纽约证券交易所TAQ数据库,异常交易由销售条件“COND”表示,该条件具有字母代码,但“E”、“F”和“I”除外。该步骤规则指出,纽约证券交易所TAQ数据库存在问题,与Barndor Off-Nielsen等人(2009)的2条规则相对应。删除被认定为优先股或认股权证的分录。对于纽约证券交易所TAQ数据库,应删除所有带有非空后缀指示符的交易。6、合并具有相同时间戳的条目。合并本身是使用中间价完成的。这一步骤对应于Barndorff-Nielsen等人(2009)的T3规则。合并同时输入在文献中很常见,但有争议,因为它会导致最大的数据删除。Barndorff-Nielsen等人(2009年)认为,这种违反规则的行为似乎是不可避免的。然而,很少有研究忽略了这一规则,如Liu等人(2018),他们使用同时具有多个观测值的数据,通过预平均估计器估计综合方差,以及Blaskes等人(2018),他们直接在零膨胀自回归条件持续时间模型中建模零持续时间。然而,在我们的研究中,为了简单起见,我们求助于合并simultaneousentries。7、删除价格等于零的分录。这一步骤消除了数据集中的明显错误,并符合Barndorff-Nielsen等人(2009)的P2规则。8、删除价格偏离50个观测值的中心中位数10个以上平均绝对偏差的条目。考虑中的观测值不包括在滚动中心正中。这一步骤对应于Barndorff-Nielsen等人的Q4规则。

26
nandehutu2022 在职认证  发表于 2022-6-11 04:42:00
(2009).在数据清理之后,估计了Ornstein–Uhlenbeck过程的参数。在最大似然估计的情况下,对数似然函数通过数值方法最大化。作为初始解,我们使用矩估计法。然后,通过Rowan(1990)的Sbplx算法(Nelder-Mead算法的一种变体)迭代找到最优解。在估计过程中,我们面临以下关于分布假设的问题。我们考虑了基于正态分布的theOrnstein-Uhlenbeck过程。这是一个限制性很强的假设,因为财务数据往往表现出严重的尾部和跳跃。虽然有点罕见,但大跳跃会给基于最大似然的估计带来问题。一个大的跳跃超调时间段与假设的波动过程不一致,波动过程与时间段成正比,最大似然估计量将这种跳跃归因于噪声分量。这导致了Ornstein–Uhlenbeck过程σ的零方差和noisevarianceω的高估。为了避免此类问题,我们将大跳跃视为异常值,并将其从数据中移除以进行估计。在初始参数值处,我们移除了所有对数可能性最低的观察值的1%。在随后的分析中,再次包括删除的观察结果。在模型中加入跳跃可能会改进我们留给未来研究的方法。1e级-042e-040 10 20 30 40 50方差估计量的抽样区间估计-姆莱蒂克-最大似然误差-2018年2月22日CVX/XOM对的NRVolatility图4:2018年2月22日CVX/XOM对的Volatility特征图。4.2估计器性能我们根据TICK数据比较噪声敏感最大似然估计器(TICK-MLE)和噪声鲁棒最大似然估计器(TICK-MLE-NR)。

27
何人来此 在职认证  发表于 2022-6-11 04:42:03
第一个问题是,观察到的价格中是否确实存在市场微观结构噪音。由于高频数据研究一致认为存在噪音(参见Hansen和Lunde,2006),我们仅使用图形分析来解决此问题。在图4中,我们采用了所谓的波动率特征图。该图显示了方差的平均估计值对采样间隔的依赖性。对于第k次观测,采样间隔k指的是由每个第k次观测组成的数据。例如,值1对应于完整的刻度数据,而值2对应于每秒丢弃的观测值。采样间隔k的观测次数约为n/k,其中n是完整蜱虫数据的观测次数。我们可以在图4中看到,噪声敏感方法估计的方差随着观察次数的增加而增加。这正是市场微观结构噪音导致的行为。另一方面,噪声鲁棒估计器在常值附近保持不变。对于k=1,TICK-MLE方法的偏差非常大,导致价格波动图像非常扭曲。关于市场微观结构噪声的第二个问题是,在实践中是否满足独立的白噪声消费。Hansen和Lunde(2006)分析了在纽约证券交易所和纳斯达克交易所交易的股票,发现价格中存在的市场微观结构噪音取决于时间和有效价格。使用波动率特征图,他们注意到波动率随着观察次数的增加而减少,这只能通过噪声过程中的创新与有效回报负相关来解释。当我们分析股票价格时,我们得到了相同的结果。

28
mingdashike22 在职认证  发表于 2022-6-11 04:42:06
然而,当我们分析成对股票之间的价差时,噪声敏感方法估计的波动性在绝大多数天内随着采样间隔的缩短而明显增加,如图4所示。我们认为,传播过程中的噪声源是价格过程中噪声源的两倍,价格过程减少了噪声的依赖性。因此,我们认为白噪声假设对于成对扩散过程是合理的,即使它不适合价格过程本身。表2列出了通过TICK-MLE和TICK-MLE-NR方法估计的每一对稀有物种的平均参数。两种方法的估计平均值u非常相似,而TICK-MLE方法的参数τ和σ要高得多。用TICK-MLE方法估计时,平均而言,回归速度τ高出6.36倍,标准误差σ高出2.21(方差σ高出4.78)。请注意,表2报告的是标准偏差σ,而不是方差σ。根据我们的理论和图4,我们认为TICK-MLE方法对τ和σ的估计存在明显偏差,应避免使用这种估计。

29
mingdashike22 在职认证  发表于 2022-6-11 04:42:09
建议的TICK-MLE-NR方法,TICK-MLE估计器TICK-MLE-NR估计器pairuτσuτσBP/CVX-1.0546 29.9279 1.7401·10-2-1.0552 3.9524 0.6676 · 10-2BP/E 0.1149 35.7787 1.7458·10-20.1149 6.5204 0.9428 · 10-2BP/PSX-0.8416 25.5638 1.9848·10-2-0.8418 4.1090 0.8054 · 10-2BP/RDS-A-0.4256 65.3009 1.7258·10-2-0.4256 6.4025 0.6903 · 10-2BP/TOT-0.3324 49.7040 1.8318·10-2-0.3326 7.0370 0.8302 · 10-2BP/XOM-0.8230 26.4986 1.5536·10-2-0.8240 3.0105 0.6908 · 10-2CVX/E 1.1697 18.0115 1.6074·10-21.1690 4.4924 0.8804 · 10-2CVX/PSX 0.2129 21.9259 1.8796·10-20.2130 3.9646 0.8357 · 10-2CVX/RDS-A 0.6286 28.4128 1.7110·10-20.6284 3.7525 0.6507 · 10-2CVX/TOT 0.7223 24.6909 1.7381·10-20.7233 4.8954 0.8190 · 10-2CVX/XOM 0.2316 33.6227 1.5280·10-20.2316 3.2192 0.5324 · 10-2E/PSX-0.9566 19.8339 1.9473·10-2-0.9565 5.6958 1.1065 · 10-2E/RDS-A-0.5393 32.5781 1.6314·10-2-0.5396 5.9070 0.8110 · 10-2E/TOT-0.4473 56.8259 1.9806·10-2-0.4472 10.1327 0.9431 · 10-2E/XOM-0.9389 15.2862 1.3825·10-2-0.9388 3.4012 0.7846 · 10-2PSX/RDS-A 0.4160 22.8768 1.9327·10-20.4161 3.6241 0.8121 · 10-2PSX/TOT 0.5094 23.1866 2.0295·10-20.5096 5.5541 1.0106 · 10-2PSX/XOM 0.0186 19.4030 1.7160·10-20.0186 2.8399 0.7516 · 10-2RDS-A/TOT 0.0933 51.7991 1.7501·10-20.0934 7.1039 0.6976 · 10-2RDS-A/XOM-0.3985 25.8139 1.5277·10-2-0.3987 2.7363 0.5473 · 10-2TOT/XOM-0.4907 21.0923 1.5298·10-2-0.4910 3.5759 0.7001 · 10-2平均值-0.1491 30.8635 1.7368·10-2-0.1492 4.8537 0.7862 · 10-表2:noisesensitive和noise robust估计器估计的Ornstein–Uhlenbeck过程参数的平均值。另一方面,在利用所有可用的滴答声数据时,不会受到噪音的影响。4.3时变参数在本节中,我们介绍了用于Ornstein–Uhlenbeck过程时变参数的时间序列模型。

30
kedemingshi 在职认证  发表于 2022-6-11 04:42:12
我们假设参数值每天都会发生变化,i=1,h、 换言之,我们假设时变参数遵循分段常数过程,其中参数在一整天都是常数。对于每个参数,我们考虑单独的模型。这些模型的主要目的是预测参数的未来值。日平均参数uiis建模为AR(1)过程,开盘价为X0,离子日为外生变量,即ui=a+bui-1+cX0,i+εi,i=1,h、 (71)其中a、b、c是系数,εiis是高斯白噪声。这与Liu等人(2017)的双均值回复过程非常相似。在他们的研究中,他们认为价格在两个频率上遵循两个均值回复过程。低频率对应于每日开盘和收盘价格,而高频率对应于日内价格。在我们的例子中,低频均值回复过程由日均值参数的自回归过程表示。仅由平均值模拟的日反转速度参数τiis,即τi=a+εi,i=1,h、 (72)式中,ais为系数,εiis为高斯白噪声。τiis的提前一步预测,然后是其过去值的平均值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:07