感觉表达的不够简洁, 其实就是我有一个完整的数据集, 然后想抠掉一些值让它们缺失, 缺失率矩阵长成酱紫:
missing rate
wk1 wk2 wk3 wk4 wk5 wk6
group1 0.01 0.01 0.02 0.04 0.04 0.06
group2 0.02 0.02 0.03 0.05 0.06 0.08
group3 0.02 0.03 0.03 0.04 0.05 0.05
缺失的模式是单调的, 缺了第i周的数据, 之后的数据也全部缺失, 也就是酱紫:
id wk1 wk2 wk3 wk4 wk5 wk6
1001 2.65 3.08 3.14 . . .
1002 5.76 4.54 3.98 4.06 3.51 3.42
1003 4.53 . . . . .
我考虑的办法是先抽第一周缺失的人, 把他们删掉, 再在剩下的数据集里抽第二周缺失的人, 再删掉, 继续抽第三周, 以此类推.
这个问题应该有大牛曾经做过, 求大家畅所欲言~



雷达卡




京公网安备 11010802022788号







