楼主: kedemingshi
656 17

[量化金融] 具有随机梯度的学习门限型投资策略 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-24 07:36:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Learning Threshold-Type Investment Strategies with Stochastic Gradient
  Method》
---
作者:
Zsolt Nika, Mikl\\\'os R\\\'asonyi
---
最新提交年份:
2019
---
英文摘要:
  In online portfolio optimization the investor makes decisions based on new, continuously incoming information on financial assets (typically their prices). In our study we consider a learning algorithm, namely the Kiefer--Wolfowitz version of the Stochastic Gradient method, that converges to the log-optimal solution in the threshold-type, buy-and-sell strategy class.   The systematic study of this method is novel in the field of portfolio optimization; we aim to establish the theory and practice of Stochastic Gradient algorithm used on parametrized trading strategies.   We demonstrate on a wide variety of stock price dynamics (e.g. with stochastic volatility and long-memory) that there is an optimal threshold type strategy which can be learned. Subsequently, we numerically show the convergence of the algorithm. Furthermore, we deal with the typically problematic question of how to choose the hyperparameters (the parameters of the algorithm and not the dynamics of the prices) without knowing anything about the price other than a small sample.
---
中文摘要:
在在线投资组合优化中,投资者根据不断收到的有关金融资产(通常是其价格)的新信息做出决策。在我们的研究中,我们考虑了一种学习算法,即随机梯度法的Kiefer-Wolfowitz版本,它在阈值类型的买卖策略类中收敛到对数最优解。该方法的系统研究在投资组合优化领域是新颖的;我们旨在建立用于参数化交易策略的随机梯度算法的理论和实践。我们在各种各样的股票价格动态(例如随机波动性和长记忆)上证明,存在一种可以学习的最优阈值型策略。随后,我们用数值方法证明了算法的收敛性。此外,我们还处理了一个典型的问题,即如何选择超参数(算法的参数,而不是价格的动态),而不知道除了小样本以外的任何价格。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Portfolio Management        项目组合管理
分类描述:Security selection and optimization, capital allocation, investment strategies and performance measurement
证券选择与优化、资本配置、投资策略与绩效评价
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Learning_Threshold-Type_Investment_Strategies_with_Stochastic_Gradient_Method.pdf (2.21 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:投资策略 Optimization Quantitative Applications Computation

沙发
可人4 在职认证  发表于 2022-6-24 07:36:40
用随机梯度法学习阈值型投资策略信息技术和生物科学的索尔特·尼卡法库蒂(Solt NikaFaculty)巴达佩斯天主教大学(Hungaryzsolt)。nika@itk.ppke.huMikl奥斯·拉索尼阿尔弗雷德·雷尼数学家研究所(Sungarian Institute of Mathematics Sungarian Academy of Sciences Budapest,Hungari,2019年6月)抽象在线投资组合优化投资者根据金融资产(通常是其价格)上不断增加的新信息做出决策。在我们的研究中,我们考虑了一种学习算法,即随机梯度法的Kiefer-Wolfowitz版本,该算法在阈值类型的买卖策略类中收敛到对数最优解。该方法的系统研究在投资组合优化领域是新颖的;我们旨在建立用于参数化交易策略的随机梯度算法的理论和实践。我们在各种各样的股票价格动态(例如随机波动性和长记忆)上证明,存在一种可以学习的最优阈值型策略。随后,我们数值证明了算法的收敛性。此外,我们还处理了一个典型的问题,即如何选择超参数(算法的参数,而不是价格的动态),而不知道除了小样本以外的任何价格。随机梯度;对数最优投资;在线投资组合选择1简介投资中有一种技术分析师的方法,其投资决策基于过去的数据,如价格、技术指标或交易量。这些决策是由过去数据的一些函数决定的,这些函数称为交易规则或策略函数。在算法交易中,这些决策是由计算机自动执行的。

藤椅
能者818 在职认证  发表于 2022-6-24 07:36:43
算法交易最典型的子类别之一是高频交易,其中有利的决策必须在几秒钟甚至几毫秒内做出[2]。考虑到这些算法的性质,那些需要巨大计算能力的算法并不高效,因为它们速度很慢。例如,非参数方法或复杂的机器学习算法在具有巨大计算机功能的大数据集上运行良好(参见[3]中的非参数方法调查和机器学习方法[4]中的摘要)。另一方面,如果有精确的参数估计,基于价格或指数动态的参数模型可能会给出相当好的结果。为了得到令人满意的估计,同样需要一个大数据集,而且决策通常对估计的误差很敏感。为了解决上述问题,我们使用Kiefer–Wolfowitz方法,该方法允许我们(i)从初始步骤开始立即做出决策;(ii)在新信息/数据到达时进行处理,无需等到我们有足够大的数据集,因为战略功能在每一步都有所改进,(iii)无需估计动力学参数。通过这种方法,我们的目标是优化对数效用投资(最大化财富对数的期望值)。该方法还能够跟踪市场的变化,我们在这里忽略了这一点,以便研究该方法本身,而不是市场变化。随机近似[5](或Robinson-Monro方法)是一种迭代方法,用于确定根(θ):=E[Xt,θ]=m,其中,Xt是一个随机过程,θ是一个参数,m是一个常数。基本上,这是牛顿-拉斐逊方法的随机版本,其中有连续观测的函数加载随机性/噪声。

板凳
可人4 在职认证  发表于 2022-6-24 07:36:46
如果函数的导数存在,则该方法可用于优化。当导数不存在或未知时,Kiefer和Wolfowitz提出了基于连续观测的有限差分近似。该方法是随机梯度法的一个版本。尽管如此,随机近似或Kiefer-Wolfowitz并没有像我们这里所做的那样直接用于优化参数化策略。我们希望这篇介绍投资理论中方法使用的文章能够进一步发展。其他研究涉及不同的方法,如学习美亚期权的参数化停止时间[7]或清算的最佳停止时间[8]。应用该算法的其他典型领域是CVAR分位数的估计[9]、[10]或[11]。文献[12]中还研究了订单的最优拆分。在第2节中,我们介绍了可以通过Kiefer–Wolfowitz算法优化的方式参数化的阈值策略。然后在第3节中,我们展示了该算法的工作原理以及最优解的存在。在第4节中,我们给出了算法执行的数值结果,并讨论了如何以合适的方式选择算法的超参数。在本文中,我们对投资理论进行了一些常见的简化:投资只包含一项风险和一项无风险资产,当然,这些可以放宽。鉴于学习方法的性质,我们只关注离散时间模型。2对数最优投资中的阈值策略在本节中,我们将介绍我们希望在下一节中应用学习方法的财务背景。

报纸
mingdashike22 在职认证  发表于 2022-6-24 07:36:49
首先,我们从一些关于投资的初步信息开始,然后介绍我们的阈值型战略,并讨论它如何与对数最优投资理论相联系。2.1投资组合投资(Portfolio Portfolio investment),从数学上讲,是控制理论的一个应用领域,其中控制过程是投资者决定在哪种资产中分配其当前财富,独立过程通常是金融资产的价格。对数效用函数经常被用作目标函数,原因有几个。让我们表示无风险过程bt和风险资产St,其中t∈ N是离散时间参数。在本研究中,我们不想关注利率的影响,因此,无风险过程是恒定的(假设利率为零,因此我们不需要贴现价格)。投资组合的价值是投资者的财富,其时间演变通常写为WTWT-1= (1 - πt)BtBt-1+πTST-1,其中πt∈ [0,1]是一英尺-1-可测量的函数,称为策略,即当前财富的多少应在两种资产之间进行分割的分数。显然,πtca只能是t以下信息的函数- 1因为投资者无法展望未来。在金融数学中,价格的对数增量在数学上有几个公认的特性,这些特性被称为股票价格的程式化事实[13]。可以方便地在原木收益率而不是股价上建立动态。日志返回HT:=日志StSt公司-1..由于无风险资产的价格是恒定的(因此其分数为1),我们可以将财富简化为WTWT-1= 1 - πt+πt。(2.1)投资者的目标是使效用函数最大化→∞tE[对数(Wt)]。

地板
kedemingshi 在职认证  发表于 2022-6-24 07:36:52
(2.2)如【14】所示,如果选择的策略π能够最大化增长的条件预期g:=E【log(Wt/Wt-1) |英尺-1] → 最大化,或在我们的财务条件下,它等于g:=E[对数(1- πt+πteHt)| Ft-1] → 最大化(2.3)条件期望g是一个随机变量,可在Ft上测量-1、Ft条件-1包含投资者或任何人都可以访问的更多信息。在算法中,我们需要指定我们使用的信息(例如过去的价格或股票市场指数),因此我们只能在条件为随机变量的情况下优化传统平均值。我们将其表示为▄g(X)=E[对数(1- πt+πteHt)| X],(2.4),其中X是Ft-1-可测量(多元)随机变量。在下面的章节中,我们将展示如何将策略过程π参数化,以便能够学习对数最优策略,然后如何选择变量X.2.2动力学。本方法可用于几种类型的股票价格动力学。重要的是,在以下情况下使用这种动态:(i)最优策略存在并导致实现其最优的投资组合;(ii)价格动态是现实的、合理的。因此,我们依赖于【15】中引入的时间序列类,称为条件高斯类,以及它的一个示例,离散高斯随机波动率(DGSV):Ht=u+αHt-1+σeYtρεt+p1- ρηt, (2.5a)Yt=∞Xj=0βjεt-j、 βj,u,σ∈ Rα, ρ ∈ [-1, 1]. (2.5b)该股票价格模型具有几个可取的特性:其统计矩和自相关函数是真实的,还包括长记忆和杠杆效应。[15]中提供了对数最优解的存在性。我们还使用更简单的模型来更好地理解算法的行为。如AR(1)orMA(∞) 工艺:Ht=u+αHt-1+σεt:AR(1),(2.6)Ht=u+∞Xj=0βjεt-j: 文学硕士(∞).

7
nandehutu2022 在职认证  发表于 2022-6-24 07:36:55
(2.7)系数βj:=b(1+j)-波段选择b>0和0.5<b<1可确保2.7具有较长的内存。2.3阈值策略(2.3)中的对数最优策略只能在已知股票价格动态参数的情况下计算。在未知情况下,策略的确切形式需要使用数值积分来获得每个时间步t的最优决策。在[15]的第3节中,提出了对数最优的近似策略。他们表明,在实际数据上,它表现良好,尽管他们没有给出误差的数学估计。这种近似策略减少了πt的可能决策空间∈ [0,1]到两个状态π∈ {0, 1}. 对于真实的日志返回数据,此限制不会导致相当大的损失,并且可以用于学习算法,而日志最优解则不能。如果可以计算条件期望,则此想法可以用于任何参数动力学。[15]中提出的近似策略是πlint=(1,如果E[Ht | Ft-1] >0,0,否则,(2.8),这是(2.3)中要求的一阶泰勒展开的结果。也就是说,如果条件期望值高于0,投资者应该只购买风险资产。该策略属于阈值策略领域。我们注意到,我们现在正在零利率环境下工作。如果没有这一假设,只要条件预期高于利率,tradingrule就会修改为买入。由于策略的结构,我们将其称为阈值策略。我们不需要upperscript lin,因为我们只使用随机梯度方法研究这种类型的策略。在大多数参数模型中,可以计算条件期望,因此我们最终得到一个过去数据的函数,我们在这里称之为阈值函数:f(过去数据):=E[Ht |过去数据]。

8
可人4 在职认证  发表于 2022-6-24 07:36:57
使用阈值函数的2.8的等价形式是πt={f(过去数据)>0},(2.9),其中,如果x>0,则函数1{x>0}为1,否则为0。我们想在这里用指标函数优化的增长(2.3)的条件预期是▄g=E[log(1-{f(过去数据)>0}+{f(过去数据)>0}eHt |过去数据]。(2.10)该函数仍然是一个随机变量,因为它是过去数据的函数。在下面的小节中,我们将介绍一些如何处理“过去的数据”的情况,但投资者当然有责任告诉他们使用哪些过去的值。命题2.1给出了当有人从过去的数据中选择值时,如何以及应该考虑什么的帮助。利用随机梯度法,我们可以优化一些参数的期望值。因此,在下文中,我们将优化g的扩展值。如果我们通过θ(一个或多变量实数)参数化条件增长,那么优化任务就是找到增长的最大值(θ):=E[~g(Xt-1,θ)],(2.11)式中g(Xt-1,θ)是(2.3)的参数化版本。2.4马尔可夫策略让我们假设投资者在时间t投资之前只使用一个可用值,并将此变量称为xt-它可以是过去的股票回报或指数或更复杂的东西,例如过去回报的加权平均数。自然选择可以是之前的回报值,即Ht-1我们还是坚持这个简单的例子。马尔可夫策略下(2.3)的条件增长:E[log(1- πt+πteHt)| Xt-1]. (2.12)我们需要对策略中的阈值函数进行参数化,以便能够使用随机梯度法。一个方便的选择是线性函数;在本文中,我们不解除这一限制,但我们提到Xt-1可以是Ht的函数-1想法。πt:={Xt-1>θ}. (2.13)在(2.11)中的最佳增长是g(θ)=E[Ht{Xt-1>θ}].

9
大多数88 在职认证  发表于 2022-6-24 07:37:00
(2.14)在第3节中,我们将使用Kiefwer–Wolfowitz方法优化该函数。下面的定理显示了最佳阈值(θ*) 马尔可夫战略。提案2.1。假设可微函数φ(x):=E[Ht | Xt只有一个根-1=x],如果x>0,则φ(x)>0。此外,让我们假设返回过程是平稳的。那么φ(x)的根就是唯一的最优阈值:θ*= {x |φ(x)=0}。(2.15)证明。为了简单起见,假设Xt-1有pdf。增长的条件期望为g(θ)=E[Ht{Xt-1> θ}]=EE[Ht | Xt-1] {Xt-1>θ}.自E[Ht | Xt起-1] 是Xt的函数-1,称之为v(Xt-1) 并表示Xt的pdf-1作为fX(x),预期值为z∞θv(y)fX(y)dy。积分具有最佳值,其中-v(y)fX(y)=0。由于fX(y)是非负的,因此,最佳阈值是v(y)=0,从而结束我们的陈述。备注1。该定理的主要信息是,只有那些信息才能用于优化算法中,这些信息与价格过程的均值无关。平均独立性的概念在计量经济学中是众所周知的,它的性质比不相关强,但比随机独立性弱。备注2。命题2.1的一个结论是,如果策略只能为0或1,则线性近似策略是对数最优的。这仅在单变量情况下是正确的。对于一个简单的示例,让我们将日志返回建模为一个自回归过程,并将以前的日志返回值用作“过去的数据”。示例2.1(AR(1))。按(2.6)定义。

10
kedemingshi 在职认证  发表于 2022-6-24 07:37:03
条件期望isE[Ht | Ht-1=x]=u+αx。其根,即最佳阈值为θ*= -uα.当α<0时,如果x>0,则定理2.1中关于φ(x)>0的假设为假,但如果我们将(2.13)中的不等式符号改为πt,则最优性为真:={Xt-1<θ}.(我们提醒读者,预期的日志返回是不同的,u/(1)- α).)从示例中可以看出,要确定阈值,我们要么需要从足够长的样本中估计u和α,要么学习θ的值*通过使用随机梯度。在更现实的动力学中,需要估计两个以上的参数。此外,阈值对α的估计误差非常敏感。示例2.2(DGSV)。根据(2.5)将日志返回Htbe为DGSV过程。其条件期望isE[Ht | Ht-1=x]=u+αx+σρE[eYt | Ht-1].条件期望是未知的,但我们将在后面的数值结果中看到,存在唯一的解。2.5非马尔可夫策略-多变量情况如果投资者希望使用更多信息,例如处理长记忆或波动性信息,也有可能。我们在这里展示了两种可能的选择,一种策略使用多个过去的回报数据,另一种使用波动率信息作为额外信息。策略πt={Ht-1+θHt-3+θHt-3+···>θ}或(2.16a)πt={Ht-1+θeνt-1> θ},(2.16b)其中θ,θ。是我们希望优化的参数和νt-1是基于Ft信息对波动率对数的估计-1(即νt-1: =E[Yt | Ft-1]). 具有对数波动率的第二种策略的设计可能看起来很奇怪,但文献[15]中对数最优的线性近似策略表明,它是Ht的线性函数-1和νt-1、波动性策略选择的一个重要方面是,我们能够抓住杠杆效应。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 20:58