楼主: 能者818
1442 48

[量化金融] 预测欧洲日前电价:以下因素的重要性 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-1 06:39:07
特别是考虑到培训集ST=(Xk,pk)Nk=1,训练神经网络要解决的优化问题是:minimizeWNXk=1kpk- F(Xk,W)k,(10),其中F:Rn→ Ris神经网络图。选择平均绝对误差而不是更传统的均方根误差是因为一个简单的原因:由于电价有非常大的峰值,欧几里德标准将对尖峰价格给予太多的重视。优化问题是通过单启动(singlestart)和Glorot初始化(52)以及solvedusing Adam(53)来初始化的,Adam是随机梯度下降法的一个版本,用于计算每个模型参数的自适应学习率。选择Adam有一个明确的原因:由于学习率是自动计算的,因此与其他优化方法相比,调整学习率所需的时间更短。与Adam一起,预测者还考虑提前停止,以避免过度调整。5.2。双市场日前预测员单一市场模型的一个可能变体是预测单个模型中两个市场的价格的预测员。虽然这一点一开始似乎有悖常理,即向模型中添加额外的输出可能会影响其预测我们真正感兴趣的24个价格集的能力,但事实上,这种方法可以导致神经网络能够更好地推广。5.2.1. 概念构想预测两个市场的总体思路是,由于我们预计两个市场的价格是相互关联的,并且具有相似的动态,因此通过在单个模型中预测两个时间序列,我们期望神经网络能够了解更准确的关系。特别是,经验表明,DNN可以学习在某种程度上可以在任务间推广的特性【55】。

22
大多数88 在职认证  发表于 2022-6-1 06:39:10
同样,也表明,通过强制DNN学习辅助相关任务,可以提高性能和学习速度[56,57]。有一些可能的假设可以解释为什么多输出训练有助于提高绩效:1。最简单的解释是数据量:随着可用数据的增多,神经网络可以学习更多相关特征。此外,由于任务是相关的,神经网络有更多的数据来学习所有任务共有的特征。第二个原因是规范化:通过解决不同的任务,网络被迫学习对所有任务有用的特性,并且不超过单个任务的数据。5.2.2. 模型实施考虑电力市场B和与B相连的第二个电力市场F。然后,通过p=【pB,…,pB,pF,…,pF】>∈ R、 即市场B和F的48日前价格集,并保持其余DNN参数定义不变,新的DNN结构如图3所示。此外,由于两种模型仅在产出规模上有所不同,实施细节与第5.1.5节中针对单一市场模型所定义的完全相同。xxxx。。。XNZZZZ。。。Z1NZZZZ。。。z2npB。。。pBpF。。。PFHIDDENLAYERHIDDENLAYERINPUTLAYOUTPATLAYER。。。图3:DNN同时预测两个市场的日前价格。6、导言中解释的特征选择算法,虽然文献中提出的电价预测特征选择方法提供了良好且快速的算法,但它们有两个缺点:1。他们在不考虑模型性能的情况下执行过滤步骤。2、对于非线性方法,需要转换不同的输入,即。

23
kedemingshi 在职认证  发表于 2022-6-1 06:39:14
未对原始特征集进行选择,因此,某些特征信息可能会丢失。因此,我们提出了一种非线性包装方法,直接评估预测模型上的特征;特别是,虽然该方法的计算要求更高,但它可以提供更好的选择,因为它使用真实的预测性能,而无需任何数据转换。6.1. 算法定义在第3.3节中,我们介绍了TPE算法,一种超参数优化方法,以及函数ANOVA,一种评估超参数重要性的方法。在本节中,我们结合这两种方法来构建一个特征选择算法,该算法包括四个步骤:1。将特征建模为超参数。2、优化超参数/特性。3、分析结果。4、选择重要功能。6.1.1。将特征作为超参数该算法的第一步是将特征的选择建模为模型超参数。特别地,我们考虑两种类型的特征:1。二进制特征θB,其选择可以通过二进制变量进行,即θB∈{0,1},其中θB=0表示特征排除,θB=1表示特征包含。二进制特征表示传统算法考虑的特征类型。例如,是否包括节假日数据或是否在ARIMAmodel中选择特定的滞后。2、整数特征θI,它不仅可以建模输入的包含排除,还可以选择一些相关的大小或长度,即θI∈ Z、 其中θI=0表示排除。例如,价格数据过去的天数或ARIMA模型的最大滞后时间。鉴于这些定义,使用超参数空间ΘBand将二元特征建模为超参数,超参数setB={1,…,nB}。

24
能者818 在职认证  发表于 2022-6-1 06:39:17
同样,整数特征由超参数空间Θ和超参数集I={nB+1,…,nB+nI}建模。最后,整个超参数空间由Θ=ΘB定义∪ Θi和由z=B设置的超参数∪ 一、 6.1.2。特征优化算法的第二步是在超参数特征空间上执行aTPE优化。该算法的结果是最佳特征选择θ*与H组一起=(θk,pk)Tk=1个特征性能对,其中pk表示使用特征选择θk时的模型预测精度。特征是θ的一部分的事实*, 不保证功能相关;具体而言,功能可能对性能影响很小或没有影响,但只要没有负面影响,它可能会出现在最佳配置中。因此,如果不考虑进一步的处理,该算法可能会选择冗余特征,进而导致计算量更大的模型,并增加超过6.1.3的风险。特征分析为了解决检测不必要特征的问题,该算法包括第三步,其中分析特征的重要性。特别是,使用[44]中提出的函数方差分析方法,该算法分析H,并提供每个特征i和每个成对交互{i,j}的重要性,作为对性能方差V的百分比贡献。使用第3.3.2节和第(2)-(3)节中给出的定义,该算法计算特征成对交互的重要性:F{i}=V{i}V,F{i,j}=V{i,j}V.(11)此外,对于每个特征i∈ Z和特征实例化θi∈ Θi,该算法还提供了预测的边际性能^a(θi)。6.1.4. 特征选择算法的第四步也是最后一步是选择本身。

25
mingdashike22 在职认证  发表于 2022-6-1 06:39:20
特别地,利用获得的F{i},F{i,j}和^a(θi),选择过程执行以下步骤:1。定义阈值参数 ∈ (0,1)。2。通过丢弃不会提高或降低性能的特性来进行预选。特别是,对于{i}重要性大于:U*= {i∈ Z | F{i}>}, (12a)或至少有一个成对贡献F{i,j}大于:U*= {i∈ Z | j∈ Z \\{i}:F{i,j}>}.(12b)3。U中的其余功能*∪ U*,执行第二次选择U*通过丢弃包含时预测边际性能^a(θi)低于排除时预测边际性能^a(θi)的特征,即:U*= {i∈ U*∪ U*|  θi∈ Θi:uθi,0<^a(θi)},(12c),其中uθi,0表示排除特征i.4的边际性能^a(θi=0)。最后,可通过以下方式获得选定的二进制特征集:U*B=U*∩ B、 (12d)类似地,对于最优整数特征集*一、 选择是根据功能本身和最佳性能的实例化来完成的:U*我={i,θ*i} | i∈ U*∩ 一、 θ*i=argmaxθi^a(θi).(12e)6.2。案例研究为了评估所提出的算法,我们使用它来选择预测比利时价格的特征,并首次评估市场整合的影响,即法国特征对预测比利时价格的影响。为了进行分析,我们考虑了第5.6.2.1节中提出的第一个和更简单的DNN。特征定义为了执行特征选择,我们首先需要将每个可能的输入建模为二进制或整数特征。

26
mingdashike22 在职认证  发表于 2022-6-1 06:39:23
如第4节所述,可用功能包括日前电价带pF、日前电网负荷预测Lb和Lf、日前可用发电量预测Gb和Gf以及公共假日日历Hb和HF。考虑到目前的市场情况,我们的目标是预测比利时日前价格的时间序列向量pBh=[pBh+1,…,pBh+24]>,日前负荷lBh=[lBh+1,…,lBh+24]>和lFh=[lFh+1,…,lFh+24]>,日前容量世代gBh=[gBh+1,…,gBh+24]>和gFh=[gFh+1,…,gFh+24]>,的使用应建模为二进制特征θlB,θlF,θgB和θgF。同样,对于公共假日,特征也可以建模为二元变量θHBandθHF。特别是,由于一天中的24小时是否有假日,假日定义为模型输入XHB,XHF∈ {0,1},0和1分别表示无假日和假日。为了对比利时的价格进行建模,我们需要使用积分功能来选择考虑的过去值的数量。特别是,由于价格显示每日和每周的季节性,我们必须使用两个整数特征:θpB,d∈ {1,2,…,6}作为特征建模最近一周的过去天数(每日季节性)和θpB,w∈ {1,2,3}作为特征建模,每周的天数(周季节性)。根据θpB、dandθpB、w的选择,考虑的EPEX比利时过去价格可分解为价格输入XdpB、hat日滞后和价格输入XwpB、hat周滞后:XdpB、h=pBh公司-i、 ,pBh公司-iNd公司>, (13a)XwpB,h=pBh公司-jpBh公司-jNw公司>, (13b)式中:{i,…,iNd}={i | 0≤ 我≤ 24·θpB,d- 1} (13c){j。

27
能者818 在职认证  发表于 2022-6-1 06:39:26
,jNw}={j | 1≤ k≤ θpB,w,(13d)k·168·θpB,d≤ j≤ k·192·θpB,d- 1} 需要注意的是,由于这是要预测的时间序列,我们忽略了使用非每日或每周季节性的情况,即θpB,d=0或θpB,w=0。最后,对于法国EPEX价格,我们可以使用与比利时EPEX相同的整数特性。然而,为了简单起见,我们直接考虑时间序列的相同滞后,并将法国价格建模为二元特征θpF。重要的是,尽管长度相同,但两个时间序列的选择仍然是独立的;特别是,仅对比利时的滞后进行了定义,而法国的价格则被排除或包括在内。表1总结了模型输入特性。特征域定义θpB,d{1,…,6}输入价格序列θpB的过去天数,每周滞后w{1,…,3}天,输入价格序列θpF{0,1}天,法国超前价格θlB{0,1}比利时负荷θlF{0,1}法国负荷θgB{0,1}比利时发电θgF{0,1}法国发电θHB{0,1}比利时假日θHF{0,1}法国假日表1:建模输入特征的定义。6.2.2. 超参数优化为了保证网络根据输入大小进行调整,我们同时优化DNN的超参数,即神经元数量和n。特别是,由于自然选择方法基于超参数优化,我们直接将神经元的数目作为整数超参数,并与特征一起进行优化。我们将nas域设置为整数集{100,101,…,400}和nas域{0}∪ {48,49,…,360},其中n=0表示移除第二个隐藏层,并使用深度为1的网络。6.2.3.

28
何人来此 在职认证  发表于 2022-6-1 06:39:29
实验设置为了使用所提出的算法,我们首先需要确定阈值 最小方差贡献;在我们的案例中,我们选择 = 0.5 %.此外,我们还需要选择TPE算法的最大迭代次数T;wefound T=1000,以在性能和准确性之间进行良好的权衡。特别是,考虑到训练单个模型需要2分钟,全特征选择需要30小时。虽然这似乎是一个很长的时间,但这一步骤仅在一段周期性时间后执行,例如一个月,以重新评估特征依赖性;因此,所提出的方法和设置为日前价格的时间尺度提供了一种可行且准确的方法。为了实现函数方差分析,我们使用了由[44]作者开发的python库fANOVA。同样,为了实现TPE算法,我们使用python库hyperopt[58]。6.2.4. 结果在第一次进行的实验中,我们得到了一个意想不到的结果:比利时GBA中包含/排除发电能力约占性能方差V的75%,而GBA的包含显著降低了预测准确性。由于发电容量已被其他作者成功地用作市场驱动因素[1],因此需要对这一结果进行一些解释。从显示gB时间序列的图4中,我们可以理解结果:就在从培训过渡到验证集之前,平均gB发生了重大变化,从大约14 GW下降到9 GW。

29
可人4 在职认证  发表于 2022-6-1 06:39:32
由于drasticdrop,一些基于训练集学习的关系很可能在验证集中不存在,因此,如果考虑到GBS,验证集中的预测性能会恶化。2010年2011年2013年2014年2015年2016年ValidationSettrainingSetyearFigure 4:考虑期内比利时的发电量。GBS中的这种机制变化违反了训练、验证和测试集中的条件相等的假设。因此,为了执行正确的特征选择并保证三个数据集具有相似的条件,实验设置应该忽略θgB。值得注意的是,在做出这一决定之前,我们已经考虑过对数据进行处理,以确保三组数据之间的一致性。然而,出于两个原因避免了这种选择:1。由于一些样本中的输出价格是其他样本中的输入特征,因此必须丢弃数据,以避免三组数据之间的数据污染。因此,由于数据集越大,DNN的泛化能力越好,这种实现可能会降低模型的预测精度。由于该模型的最终目标是预测最近的价格,因此尝试建立一个不再成立的投入产出关系模型是毫无意义的。考虑到这些事实,在没有θgB的情况下执行正确的特征选择。如表2所示,从新实验结果中注意到的第一个结果是,由于GBI是一个很大的误差源,sMAPE性能的方差^V减少了5倍。此外,因为它可以选择gB0.58%的特征选择,而不选择gB0.12%的特征。表2:有无gB的性能差异。不出所料,在这项新实验中获得的结果显示,不同特征之间的贡献更为分散。

30
kedemingshi 在职认证  发表于 2022-6-1 06:39:35
特别是,在第一个实验中,GBP对75%的性能差异负责。现在,如表3所示,法国的价格和负荷约占总性能差异的50%,法国的可用发电量、比利时的负荷量和过去的天数起着次要作用。对VAll主要影响的贡献64.9%法国负荷28.4%法国价格25.7%法国发电4.78%比利时负荷1.0%过去天数0.8%表3:第二次特征选择实验中单个特征的方差贡献。基于以上结果,我们可以重新选择并从可能的输入集中删除公共假日θhba和θhfa似乎都不是决定性的。同样,我们可以选择θpB,w=1,因为每周滞后的天数似乎是非临界的。最后,为了完成特征选择,我们应该使用图5所示的重要特征的边缘性能;根据这些数据,我们显然应该选择法国的价格、负荷和发电量,放弃比利时的电网负荷,并使用过去两天的价格数据。排除包括15.215.415.615.8θlF(a)法国电网负荷。不包括15.215.415.615.8θpF(b)法国价格。不包括15.215.415.615.8θgF(c)法国发电容量。排除包括15.215.415.615.8θlB(d)比利时电网负荷。1 2 3 4 5 615.215.415.615.8θpB,d(e)上周过去价格的天数。图5:五个最重要特征验证集的边际性能。结合特征,我们还对模型的超参数进行了优化。结果表明,合适的神经元数目为200个,n=320.6.3。讨论基于特征选择算法的结果,我们应该包括以下特征作为模型输入:1。法国日前负荷和发电量:2。比利时和法国最近两天的价格:3。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 04:35