楼主: 能者818
842 31

[量化金融] 增强现金管理人员的能力,通过提高预测能力实现成本节约 [推广有奖]

11
可人4 在职认证  发表于 2022-5-11 07:34:11
(2) 在这个一般模型(2)中,我们将yt,时间t的现金流值与解释变量xt1,xt2,xtnat在同一时间t,即第i个回归系数β,以及 预测误差。根据一般模型(2),根据考虑的不同解释变量,可以推导出一些特定的预测模型。为了实现这些模型,我们在R.3.3径向基函数模型中使用lm函数。金融数据通常由复杂系统产生,可能包括非线性过程。为了捕捉数据中的非线性,我们还考虑了Weigend(1994)中描述的径向基函数(RBF)模型;布鲁姆黑德和洛(1988)。为了使用RBF模型,我们首先在训练集中应用k-medoids算法(Park和Jun,2009)来划分输入空间。然后使用标量高斯RBFφ(x)进行预测:yt=b+KXk=1bkφ(kxt- ckk+ (3) 式中,yti是时间t时目标变量的值,K是聚类总数,bk是与第K个聚类相关的系数,ck是第K个聚类矩阵,xt是时间t时的输入数据点,kk是欧几里得距离 是预测误差。最后,φ(x)是下面的高斯函数:φ(x,α)=e-x/αρk(4),其中α是正整数参数,ρkis是第k簇内元素之间的平均距离。在这种情况下,预测是使用我们的解释变量和R中的一般矩阵函数的暂定集合生成的。接下来,我们提供了一个使用RBF获得的预测示例,该示例基于之前的21个现金流观察数据集1的最后3天。必须选择两个参数来使用RBF进行预测:聚类总数K,定义输入空间的划分程度,以及参数α,确定偏差点对预测的贡献。

12
kedemingshi 在职认证  发表于 2022-5-11 07:34:14
为了这个例子的唯一目的,我们设置K=5和α=10。然后,我们进行如下操作:1。我们创建输入空间(2714)- 21)×21矩阵X嵌入每行21个连续现金流。首先,我们首先将现金流转换为y(λ)t,如第3.1节所述。为了避免高价值偏见,welater通过贬低并除以标准差来标准化转化后的现金流。2.我们创建了一个长度为2693的列向量y,带有后续的现金流。3.我们使用k-medoidsalgorithm从X中的行中选择每个簇。4.我们计算ρkas,即第k个簇的元素与其中间点ck之间的平均欧氏距离。5.我们计算2693×5矩阵Φ,其中每行包含使用函数φ(kxt)计算的距离- 输入空间中的每个点到每个集群。6.通过解b=(ΦTΦ)得到权重的列向量b-1.使用最小二乘法。7.我们生成了一个3×21矩阵^X,其中前21个观测值在预测的3个现金流之前,以及一个3×6矩阵^Φ,其中第一列设置为1,其余元素是使用函数φ(kxt)计算的距离-ckk)对于^X中的每个点到每个簇中间线。8.我们通过^y=^Φb进行预测,必须通过乘以标准偏差并添加平均值和λ-转换来重新缩放。现在,我们可以将这些预测与实际值和更准确的预测进行比较,并计算预测精度,如下所示。3.4随机森林模型决策树是一种非线性模型,根据特定特征的值将输入空间分成子集。另一方面,集成方法能够通过将多棵树集成到决策林中来构建预测模型(Dieterich,2000)。

13
mingdashike22 在职认证  发表于 2022-5-11 07:34:17
回归林用于因变量的非线性回归,这些因变量是基于一组略有不同的树给出的独立输入。特别是,随机森林(RF)是随机训练的决策树的集合(Ho,1995,1998;Criminisi和Shotton,2013)。最近使用随机森林进行时间序列预测的例子可以在Kumar和Thenmozhi(2006)中找到;凯恩等人(2014年);Mei等人(2014);Zagorecki(2015)。我们使用Liaw和Wiener(2002)的R软件包randomForest进行预测,该软件包实现了Breiman的分类和回归随机森林算法(Breiman,2001)。在本文中,我们限制自己选择三个参数:随机训练树的数量(a)、在每次分割时随机抽样作为候选变量的变量的数量(b)以及用于控制匹配的终端节点中的节点大小(c)或最小观测量。例如,假设我们知道我们的现金流有很强的季节性。评估这种季节性有多强的一种可能方法是使用两个解释变量进行预测:月日和周日。因此,我们的目标是创建一个随机森林模型,并根据这两个变量预测数据集1的最后100天。下面是一个如何继续的例子:1。创建一个2617×2的矩阵X,每行包含过去现金流的月份和星期几。2.用相应的现金流创建长度为2617的列向量y。3.基于X和y创建一个模型,a=100个随机训练的树,b=2个随机抽样变量,节点大小c=50.4。生成一个100×2矩阵^X,其中包含数据集1.5的最后100笔现金流的月日和周日。

14
可人4 在职认证  发表于 2022-5-11 07:34:20
将矩阵^X输入模型以获得预测。现在,我们可以评估每个解释变量的重要性,或者在接下来的工作中测试我们预测的质量。4预测模型的比较在本节中,我们旨在评估所提出模型的预测精度,以便进行比较。自回归、回归、径向基函数和随机森林模型可能会产生不同精度的不同预测。通过比较,我们可以确定同类最佳的预测者,以供日后用于制定最佳现金管理政策。更准确地说,我们通过比较不同模型的均方误差ε(h):ε(h)=Ptest(^yt+h,使用时间序列交叉验证从1天到100天的不同预测范围(h)- yt+h)Ptest(y)- yt+h)(5)其中h是以天为单位的预测范围,^yt+his是在t+h时的预测,yt+his是在t+h时的实际观测值,y是训练集上实际观测值的算术平均值。注意,ε越接近零,预测精度越高。如果ε接近1,则性能与原始预测的平均值相似。大于1的值表明预测者没有预测能力。Hyndman和Athanasopoulos(2013)提出了两种不同的时间序列交叉验证方法:一种是训练集的固定原点,另一种是滚动原点。算法1实现了这两种交叉验证方法。算法1:时间序列交叉验证算法1输入:现金流量数据集,包括T个观测值、固定来源、要预测的观测值的最小数量g和预测范围h;2输出:不同预测范围的预测精度;3表示i=1,2。

15
可人4 在职认证  发表于 2022-5-11 07:34:24
T- G- h+1 do4选择g+h+i时的观察值- 1用于测试集;5如果F ixedOrigin=T rue,则6使用时间1、2、…、的观测值估计模型,g+i- 1.7其他8利用时间i,i+1,g+i- 1.9 end10计算时间g+h+i预测的h步误差- 1.11 end12根据获得的误差计算ε(h);如果二元变量FixedOrigin设置为真,则训练集由形成测试集的第一次观察之前发生的所有观察结果构成(方法1)。我们可以通过将FixedOrigin设置为False(方法2)并通过应用滑动观察窗口仅考虑g最近的值(例如,过去两三年)来消除最古老的观察结果。在这两种方法中,我们假设产生可靠预测所需的g观测值最少。在我们的实验中,高g值在方法1和方法2之间几乎没有差异。使用方法2,以250步为单位计算g的较小值,相当于1年的观察,结果也较差。因此,这里我们只给出方法1的结果。当有必要选择参数时,对65%最古老观测值的训练集进行测定系数R的评估,以选择每个参数的最佳值。对上述暂定解释变量进行了探索。更准确地说,我们计算了h的误差ε(h)∈ [1,2,…,100]使用算法1(方法1)对数据集为1和2的不同暂定预测模型进行预测。前65%的数据被视为训练模型的最小数据长度。

16
kedemingshi 在职认证  发表于 2022-5-11 07:34:27
结果表明,使用数据集1(表2)的RF模型和数据集2(表3)的RBF模型,月日和周日的预测能力最好。表2:100天内的模型特征和平均误差率(ε)(数据集1)。模型输入变量参数ε(标准偏差)AR p过去值p系数1.00(0.007)REG dt2,dt31,st1,st,435系数0.70(0.007)RBF 20过去值,月日K=35,α=10 0.88(0.003)RF dt2,dt31,st1,st4a=20,b=11,c=50 0.68(0.010)表3:100天内的模型特征和平均误差比(ε)(数据集2)。模型输入变量参数ε(标准偏差)AR p过去值p系数1.00(0.002)REG dt2,dt31,st1,st435系数0.96(0.008)RBF月日,周日K=10,α=10 0.93(0.008)RF月日,周日a=20,b=11,c=50 0.94(0.006)。使用表2和表3中的模型的不同预测期的相对性能分别绘制在图2和图3中。正如预期的那样,作为一个天真的预测者,自回归模型的表现并不比平均值好。在数据集1的情况下,随机森林和回归模型的表现优于径向基函数。另一方面,在数据集2的回归、径向基函数和随机森林模型之间发现了一个小的性能差异。其余插图数据集的结果如表4所示。在数据集1中,发现与回归模型相比,therandom森林模型在预测精度方面存在微小差异。

17
何人来此 在职认证  发表于 2022-5-11 07:34:30
此外,数据集1中的径向基函数模型的性能比回归和随机森林模型差,但数据集2中的性能更好。由此可知,通过考虑回归、径向基函数和使用一些基本解释变量的随机森林模型,可以提高自回归模型的预测精度。接下来,我们衡量更好的预测带来的储蓄。预测水平均方误差(ε)●●●●●●●●●●●●●●●●●●自回归回归径向基函数随机森林图2:不同预测模型的均方误差比较(数据集1)。0 20 40 60 80 1000.85 0.90 0.95 1.00预测水平均方误差(ε)●●●●●●●●●●●●●●●●●●自回归回归径向基函数随机森林图3:不同预测模型的均方误差比较(数据集2)。5更好的预测是否产生更好的现金管理政策?Gormley and Meade(2007)提出了一个动态简单政策(DSP),以证明现金流量预测在公司现金余额管理中的效用。他们建议使用自回归模型作为模型的主要输入。然而,与简单的平均模型相比,预测精度的提高很少。Gormley和Meade预计,如果现金流中存在更多系统性变化,从而提高预测精度,则使用非原始预测模型获得的节约将增加。在上一节中,我们表明,使用表4可以获得更好的现金流预测:使用方法1预测1到100天的预测期的平均预测精度。

18
kedemingshi 在职认证  发表于 2022-5-11 07:34:33
标准偏差显示在括号中,最佳值用粗体表示。数据集自回归径向基函数1 0998 0704 0880 0680(0007)(0007)(0003)(0009)2 0999 0962 0930 0942(0002)(0008)(0008)(0006)3 0997 0697 0.870)0669(0008)(0007)(0.004)(0009)4 0998 0763 0.952 0749(0006)(0007)(0.002)(0010)5 0999 0826 0.902)0821(0003)(0004)(0.002)(0006)6)6 0977 0.946 0949(0003)(0007)(0.011)(0009)不同的预测模型。在本节中,我们将验证更好的预测会产生更好的策略。因此,我们发现,一个更好的预测模型产生的储蓄明显高于一个有效预测模型获得的储蓄。在这里,我们利用了一个简单的政策,相当于Gormley和Meadeu的政策,使用第4节中详述的最佳预测者,并将其与常数平均预测的结果进行比较。由于自回归模型的预测精度几乎等于平均预测精度(表2和表3),因此与平均值的比较相当于与自回归模型的比较。在下文中,我们首先介绍了我们的经验设置;第二,我们从经验上证明,在企业现金管理问题中,使用简单的策略,预测的准确性可以节省成本;最后,我们分析了提高每日现金流量预测准确性和简单政策的潜在成本节约。5.1经验设置公司现金管理问题可以从随机的角度来解决,允许现金余额在两个极限之间徘徊:下限(D)和上限(V)。当现金余额达到这些限制中的任何一个时,进行现金转移以返回到相应的再平衡水平(d,v)。

19
nandehutu2022 在职认证  发表于 2022-5-11 07:34:36
Gormleyand Meade(2007)提出了一个使用每日预测的此类模型,作为交易成本和持有成本之间的权衡,可以总结如下:oq:一天结束时每货币单位正余额的持有成本。ou:一天结束时每货币单位负余额的短缺成本γ+:转入账户的固定成本γ-: 从账户转账的固定成本。oγ+:转入账户的可变成本γ-: 从账户转账的可变成本。回想一下第2节,我们正在处理一个真正的商业问题。因此,我们关注银行向工业公司收取的当前成本。目前的银行惯例倾向于对1和e5之间的转账收取固定成本,而不收取可变成本,因此我们将γ+=0和γ设置为0-= 0.负现金余额的每货币单位的短期成本(u)约为30%,这意味着负现金余额的高额罚款。最后,正现金余额的每货币单位持有成本(q)是非替代投资收益的机会成本。由于这不是实际成本,而是基于判断标准的机会成本,我们根据预期的替代投资回报设定了10%至20%的年收益率范围。我们首先尝试了15种不同的成本结构,它们被认为是西班牙当前成本下最可能出现的情况,如表5中的(1)所示。我们还考虑了另外两种情况,用(2)和(3)表示,以评估特定成本变化的影响。第二种情况测试短缺成本(u)的变化,第三种情况考虑引入可变转移成本(γ)。表5:成本情景。最有可能的成本情景(1)替代情景短期成本u(2)引入可变成本γ(3)持有成本q 10、15、20%每年15%。

20
何人来此 在职认证  发表于 2022-5-11 07:34:39
每年15%的短缺成本u 30%10,20,40%30%固定到账户γ+1,2,3,4,5 e3 e3从账户γ中固定-1,2,3,4,5 e3 e3可考虑γ+0%0%0.1,0.2,0.4 hV可考虑γ-在我们的实验中,现金管理模型的参数选择是从商业角度进行的。在Gormley和Meade(2007年)中,选择政策参数值D、D、v、v,以使用遗传算法最小化预期成本(Chelouah和Siarry,2000年)。在这里,由于重点放在从不同预测模型获得的政策之间的比较上,参数优化起着次要作用。因此,在比较每种预测模型和每种成本情景的节约时,这些参数是根据经验选择的,并且保持不变。然而,为了评估这些参数对预测效用的影响,基于风险承受能力研究了三种不同的情况。每年一次。负余额的成本非常高,常识引导我们将D设置为最低水平,以便只有预期现金流的给定百分比(MaxPct)才能将余额从D值变为负值。百分比越高,透支的可能性越高,因此,在这些成本结构下,保单的风险越大。我们研究了三种不同风险水平的病例:1。低风险或最大持续时间=5%。中等风险或M axP ct=10%。高风险或M axP ct=15%。另一方面,使用动态简单保险单的前提是,只要有必要,就可以向银行账户转账。实际上,这种情况是不现实的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 05:32