楼主: 能者818
1442 48

[量化金融] 预测欧洲日前电价:以下因素的重要性 [推广有奖]

31
何人来此 在职认证  发表于 2022-6-1 06:39:38
一周前比利时和法国的价格:此外,虽然不同的法国市场特征,即市场整合特征,似乎对预测准确性起着很大的作用,但结果只足以对法国数据的重要性有一个大致的认识;特别是,在做出任何进一步的结论之前,需要进行统计分析。最后,虽然我们使用了所提出的算法来选择输入特征,但我们尚未对其准确性进行评估。特别是,为了评估其性能,我们可以只使用最佳选择的特性来比较模型,而其他模型也可以使用已禁用的特性;更具体地说,我们可以通过假设检验来评估预测准确性的差异(见第7.2.4节)。7、市场整合与建模框架评估特征选择算法提供的分析基于验证集;虽然此数据集不用于训练网络,但它用于提前停止和超参数优化。因此,为了有一个完全公平和无偏的评估,我们需要使用看不见的数据对整个培训过程进行额外的比较。此外,由于特征选择结果是使用第一个提出的模型获得的,因此还需要第二个模型的结果。最后,为了进行有意义的评估,应计算结果的统计意义。为了满足这些要求,本节的目标有两个:1。通过对测试集所代表的样本数据进行DM测试,提供法国市场数据使用改进的统计意义,即市场整合。2、基于相同的统计检验,证明了双重市场预测师如何能够显著提高预测准确性。7.1.

32
可人4 在职认证  发表于 2022-6-1 06:39:41
Diebold-Mariano检验为了评估预测准确性差异的统计意义,我们使用了(5)-(8)定义的DM检验。由于神经网络是使用绝对平均误差进行训练的,因此我们也选择使用绝对误差来构建损失差异:dM,Mk=|εMk |- |εMk |。(14) 此外,我们遵循与[26]中相同的程序,对代表一天中不同时间的24个时间序列中的每一个进行独立的DM测试。原因是,当我们使用相同的信息预测24个价格集时,同一天内的预测误差将表现出高度的相关性。此外,为了对整个错误序列进行评估,我们还考虑了错误序列中k阶的序列相关性,进行了DM测试。特别是,回顾最优k步超前预测误差最大(k- 1) -根据【46】,考虑到订单23的序列相关性,我们对完全损失差异进行了DMtest。在本案例研究的各种实验设置中,我们采用了(7)给出的单侧DM测试,置信度为95%。之所以选择这一点,是因为我们想评估预测者a的表现在统计上是否明显优于预测者B,而不是预测者a和B的表现是否有显著差异(就像双边DMtest中的情况一样)。更详细地说,每小时h=1,24日,我们测试了使用法国数据的模型的无效假设,该模型的准确性与不使用法国数据的模型相同或更差。更具体地说,我们进行以下测试:(H:E(dM,Mhk)≥ 0,H:E(dM,Mhk)<0,对于H=1。24,(15)其中,[dh,…,dhN/24]>表示小时损失差异的向量序列。

33
kedemingshi 在职认证  发表于 2022-6-1 06:39:44
此外,我们进行了相同的测试,但考虑到全损失差异序列并假设序列相关性:(H:E(dM,Mk)≥ 0,H:E(dM,Mk)<0。(16)7.2. 法国市场数据:统计意义在第6.2-6.3节中,我们表明,使用关联市场的市场数据有助于提高绩效。在本节中,我们通过直接比较包含此类数据的模型与排除此类数据的模型来扩展分析,然后执行DM测试来分析统计显著性。7.2.1. 实验设置用于执行评估的模型是用于特征选择的单一市场预测者。特别是,根据获得的超参数结果,我们选择n=320和n=200;同样,考虑到在特征选择中获得的优化价格滞后,我们将前两天和一周的价格作为模型的输入序列。然后,我们将比利时的发电能力以及两国的节假日作为输入特征。然后,为了比较法国数据的影响,我们将剩余特征视为模型的可能输入,即我们比较第一个模型,不包括所有法国数据,仅考虑比利时价格与第二个模型(包括法国数据)的关系。我们分别将这两种模型称为MNoFRand MFR。此外,虽然比利时的负荷似乎不相关,但我们决定重复之前的实验,但将两种模型中的负荷都包括在内。原因有两个:1。通过加入比利时负荷,我们确保使用法国数据的良好结果不是因为模型不包括特定的比利时回归系数。此外,通过本实验,我们还可以验证特征选择算法的结果。

34
nandehutu2022 在职认证  发表于 2022-6-1 06:39:47
特别是,由于负载似乎没有起到很大的作用,我们预计有无LBS的车型之间的性能差异将很小。与之前类似,我们通过MNOFR、LBR和MFR、lB.7.2.2引用这些模型。案例1:没有LBS的模型在本实验中,我们通过评估其在测试集所代表的尚未使用数据年份的性能来比较MNOFRAGINSTMFRB。正如在实际应用中一样,为了说明最后可用的信息,这两个模型将在数天/周后重新估计。在我们的应用程序中,考虑到在GPU上训练一个模型大约需要2分钟,我们决定使用一天中尽可能短的时间重新估计它们。表4通过sMAPE对模型进行了首次比较。从第一次评估中,我们可以看到,包括法国数据似乎可以真正提高预测者的表现。为了对上述结果提供统计意义,我们进行了第7.1节所述的DM测试。获得的结果如图6所示,其中测试统计数据表示为每天24小时的每个小时,模型MNoFRMFRsMAPE上的点为16.0%13.2%。表4:样本外数据中MNOFR和MFR之间的sMAPE性能比较。虚线接受MFR具有更好的性能准确性的替代假设,置信度为95%。

35
nandehutu2022 在职认证  发表于 2022-6-1 06:39:50
从图中我们可以看出,包括法国数据在内的MFI模型的预测改进对于24日前价格中的每一个都具有统计意义。1 2 3 4 5 6 7 8 9 10 11 12 13 14 16 17 19 20 21 22 23 24小时图6:比较MNoFRand MFR时的DM测试结果。虚线以上的值以95%的置信度拒绝了无效假设,反过来,表示MFRI的准确性明显更好的情况。当在全损失差异上进行DM测试并考虑到序列相关性时,获得的指标与24小时内获得的结果完全一致。特别是,获得的p值为1.2·10-11,这证实了在预测模型中使用法国数据的强大统计意义。7.2.3. 案例2:具有LBS的模型使用相同的程序,我们将MNoFR、LBS与MFR、lB进行比较。从表5中,我们可以看到,与之前一样,包含法国数据的模型的性能优于备选模型。模型MNoFR、lBMFR、lBsMAPE 15.7%13.1%表5:样本外数据中MNoFR、lBandMFR、lBin在sMAPE方面的性能比较。为了对获得的精确度差异提供统计意义,我们再次进行DM测试。获得的结果如图7所示;如前所述,包括法国数据可以提高准确性,这对于24个预测值而言具有统计学意义。如前所述,当我们每天24小时观察时,图7:比较MNoFR、lBandMFR、lB时的DM测试结果。

36
可人4 在职认证  发表于 2022-6-1 06:39:53
虚线以上的值在5%的显著性水平上拒绝了零假设,反过来,表示MFR、LBR的准确性明显更好的情况。考虑DM测试的全损失差异与序列相关,p值为1.6·10-12,avalue同意图7,并确认使用法语数据的改进在统计上是显著的。7.2.4. 特征选择的准确性利用前两节的结果,我们可以在第6节中说明所提出的特征选择算法的准确性。特别是,在进行特征选择时,我们观察到比利时负荷的贡献很小,甚至略为负;这导致放弃lBas作为输入特性。在本节中,为了验证选择算法执行了正确的选择,我们执行DM tests来比较MNoFR、lbon和MNoFRand MFR、lbon和MFR。特别是,我们对每个模型对进行双边DDM检验,模型的零假设具有相同的准确性。为了简单起见,我们避免描述每个小时的THDM测试结果;相反,当考虑整个损失差异序列与序列相关性时,我们直接说明了DM测试的p值。从表6中可以看出,两个测试获得的p值均高于0.05,因此,不能拒绝精度相等的零假设,即使用比利时荷载的模型的统计性不存在与不使用比利时荷载的模型不同的精度。根据获得的结果,很明显使用LBS是不相关的,因此,特征选择算法执行的选项是正确的。特别是,虽然这个实验没有分析所有输入的特征选择性能,但它确实考虑了最有问题的特征。

37
何人来此 在职认证  发表于 2022-6-1 06:39:56
更具体地说,正如许多研究人员建模对p值MFR、lBvs MFR0.435MNoFR、lBvs MNoFR0.275表6:带有LBS的模型的零假设DM检验的p值与没有LBS的模型具有相同的精度。已成功地将负荷用作解释变量[6–8、27、34],并且由于负荷本身在考虑的时间间隔内没有显示任何状态变化,因此其对性能的影响非常显著。因此,通过证明该算法在丢弃负载时是正确的,我们可以对其总体精度进行评估,并且可以得出结论,该算法执行了正确的特征选择。7.3. 双市场预测员的评估在本节中,我们通过比较单一市场模型与预测比利时和法国日前价格的双市场预测员,评估使用双市场预测员和多任务的可能改进。模型由Msingel和MDualand表示,它们都使用了第6节中为单一市场模型获得的最佳特征和超参数。值得注意的是,在理想的实验中,应重新估计双市场预测者的超参数,为简单起见,我们决定直接使用单市场预测者获得的超参数。表7列出了初步比较。从第一次评估来看,使用双重市场预测似乎可以提高绩效。MSinglemdualsmap模型13.2%12.5%表7:单一和双重市场预测者在sMAPE方面的表现比较。为了对这些结果提供统计意义,我们再次对每天24小时的每个小时进行DM测试。获得的统计数据如图8所示;与之前一样,上虚线以上的点接受了MDU的替代假设,具有95%的置信度,具有更好的性能准确性。

38
可人4 在职认证  发表于 2022-6-1 06:39:59
此外,由于并非每个小时的预测都具有统计意义,因此我们在同一个图中表示了替代DM检验,其中的无效假设为MSingle的准确性等于或低于MDual。该测试的特点是较低的虚线和该线以下的任何点接受,置信度为95%,即MSingle具有更好的性能准确性。1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24-5小时图8:比较MSingleandMDual时的DM测试结果。顶部虚线上方的值表示案例,在95%的置信水平下,MDualis明显更好。同样,下虚线以下的值可以接受,95%的置信度水平,这一情况明显更糟。正如我们从图中所看到的,在24日前价格中的7日,双市场预测师的预测改进在统计上是显著的。此外,单一市场预测师在剩下的17天内的任何一天的领先价格中都没有明显的优势。因此,由于三分之一的日前价格比三分之一的价格好,剩下的三分之二的价格不差,因此我们可以得出结论,双市场预测者是一个统计上显著更好的预测者。最后,考虑到序列相关性,我们还对全损失差异进行了DM测试。一次,获得的指标与24小时内获得的结果一致:p值为9.5·10-03,测试结果证实了使用双重市场预测者时预测准确度差异的统计意义。7.4. 分析和讨论为了理解和解释所获得的结果,我们必须注意,如第2.4节所述,由于欧洲监管,欧洲电力市场的市场整合近年来一直在增加。

39
能者818 在职认证  发表于 2022-6-1 06:40:02
这种高度非线性和复杂的影响极大地改变了电价的动态,这也是我们的模型得到改进的背后。特别是,我们的预测师利用这一影响来超越传统上忽略它的替代技术:提出的第一个预测师,在输入空间中对市场整合进行建模,与忽略市场整合的模型对手相比,获得了统计上显著的改进w.r.t。第二个被提议的预测者,通过在输出空间中建模市场整合,更进一步,被证明是获得进一步重大改进的关键。对于我们的案例研究,这转化为以下结论:1。使用法国市场的功能可显著提高amodel预测比利时价格的预测准确性。结果具有统计学意义,与是否考虑比利时特征无关。2、同时预测法国和比利时价格的双市场预测师可以提高预测精度。特别是,通过解决两个相关任务,它能够学习更多有用的特征,更好地概括价格动态,并获得统计上显著的改进。3、提出的特征选择算法能够正确评估特征的重要性。此外,有意思的是,比利时EPEX的解释变量,例如负荷和发电量,对日前价格几乎没有影响。

40
kedemingshi 在职认证  发表于 2022-6-1 06:40:06
事实上,从获得的结果来看,令人惊讶的是,法国因素在比利时价格中所起的作用比比利时当地的因素更大。作为最后的讨论,有必要指出为什么作为比利时、荷兰和德国的邻国,其各自的市场在研究中没有得到考虑。不考虑荷兰的原因是,可用的在线数据量小于法国和比利时,因此,培训DNN可能会更加困难。就德国而言,不考虑的原因是,目前比利时和德国之间的电网没有直接互联。7.5. 实际应用作为最后一点,重要的是指出这些结果具有不同的实际应用。特别是,有两个主要的显而易见的应用,在这两个应用中,这项研究可以带来很大的益处。第一个也是最重要的应用是公用事业公司使用它来提高其经济效益。更具体地说,预测准确度MAPE提高1%将导致成本降低约0.1%-0.35%[59]。对于峰值负荷为5 GW的中型公用事业公司,这意味着每年可节省约150万美元【60,61】。此外,提高预测精度是拥有稳定电网的关键。特别是,随着可再生能源整合的增加,由于发电和消费之间的不匹配导致的电网失衡也在增加。为了解决这个问题,传统上采用的是需求响应方法[62–64]。通过准确预测电价,也有可能改善这种状况。特别是,当发电量大于(低于)消费量时,价格通常较低(高)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 04:36