概率预测:学习不确定性
在给出某些条件信息的情况下,大多数行业和学术数字预测项目都处理随机变量期望值的确定性或点预测。在某些情况下,这些预测足以用于决策。但是,这些预测并不能说明潜在的随机过程的不确定性。所有数据科学家的共同愿望是对不确定的未来做出预测。显然,预测应该是概率性的,即预测应采用未来数量或事件的概率分布形式。这种形式的预测称为概率预测在过去的十年中,它的受欢迎程度激增。最近的证据是2014年和2017年的全球能源预测竞赛(GEFCom)。GEFCom2014专注于针对风,太阳能,负荷和电价生成多个分位数预测,GEFCom2017专注于负荷的分层滚动概率预测。最近,M4竞赛旨在生成100
那么,概率预测到底是什么?简而言之,他们尝试对预测中的不确定性进行量化,这可能是进行最佳决策的基本要素。概率预测有三种主要形式,分位数的估计,预测间隔和全密度函数。这些预测的总体目标是在经过校准的情况下最大化预测分布的清晰度。校准是指分布预测和观测值之间的统计一致性,是预测和观测值的共同属性。清晰度是指预测分布的集中度,仅是预测的属性。
用更正式的术语来说,概率预测可以这样定义。对于时间t的随机变量Y_t,其概率密度函数定义为f_t,其累积分布函数定义为F_t。如果F_T是一个严格递增,分位数Q(吨,τ)与比例τ ε[0
题库