问题背景:
随机过程和系统的仿真,尤其碰到稀有事件时,常常采用一个新的概率测度替代原有的自然概率测度仿真,以增大稀有事件的发生概率(change of measure,重要抽样)。比如我们想通过仿真(Monte Carlo)估计样本空间中的某个集合A的概率(很小,比如10的-8次方级),如果采用自然概率测度,则平均要仿真一亿次才能得到一个样本落在这个集合里面。这样需要仿真多个亿次才能得到有效的估计。为克服这个问题,我们可以采用一个新的概率测度,在这个新的测度下,让集合A出现的概率变大,甚至大到1,也就是说仿真的每一个样本点都落在集合A里面。当然,在结果统计时,一个样本点不能算1个,而必须乘以likelihood ratio来纠偏。进一步,假设集合A的一个划分:子集A1, A2, A3. 其中A3的自然概率比A1, A2小很多(比如A1, A2在10的-8次方级,而A3在10的-12次方级). 这样估计集合A的概率时我们可以忽略A3。于是我们可以选择一个新的概率测度,让全部样本点都落在A1,A2里面。
问题描述:
对于这样一种做法,有一些事件(A3)在原有的自然概率测度下其概率不等于0而在新的概率测度下为0。根据Radon-Nikodym定理,此时Radon-Nikodym derivative是不存在的,但是likelihood ratio却可以有意义的计算,因为既然那些事件在新的概率测度下概率为0,它们在仿真过程中就不会出现,因此likelihood ratio中也不会出现分母为0的情况。
很多文献中好像都认为两者是等同的,一般都是说“likelihood ratio (or Radon-Nikodym derivative)”。很少见到说两者的区别。我是学工程的,没上过这方面的数学课程,有点疑惑,这两者到底是什么关系?另外,用上述的新概率测度仿真理论上有没有什么大的问题?当然有个前提,就是那些在新的概率测度下被剔除的事件(A3)的自然概率不能太大(相对我们要估计的概率而言)。
急盼高人指点一二,真诚感谢!