好吧,随机森林你解释不了,又引用了SVM里的机器学习的概念来碾压。但是依然无法解释需要LZ数据的独立同分布。如果每个样本之间的分布不同,怎么将模型应用于未知样本?
但是其实同分布这个问题除了用于证明模型的有效之外,根本无需考虑,这也是你所说的“大家容易忽略”的部分。因为这个分布是未知而“假设”的,因此我可以认为所有的样本在一定的应用范围内都是同分布的,只是分布未知。所以,不是大家故意忽略,而是机器学习之所以适用,就是不用考虑,因为从总体中随机抽样的样本必定服从一个未知的分布,自然不需要要求数据独立同分布。写证明性的论文你必须按这个假设去走,但是在模型的应用时,不需要考虑,除非你是神,你一眼看透它们的分布。


雷达卡

京公网安备 11010802022788号







