我有个疑问想请教大家,(我之前没接触过统计,所以描述的很外行,请见谅),
我想用几个自变量a,b,c,d去建立logistic模型,来推断桥墩会不会有影响安全的裂缝.
现在遇到问题是,
每次采样会有8组数据,在采样时,
有些桥对于自变量a,b,c,d可以采集到因变量等于1的情况
有些桥所有8组自变量都采集不到因变量等于1的情况
现在问题来了,
对于覆盖需求的桥,这八组数据中含有因变量=1的,是不是就可以直接参与建模.
对于没有覆盖需求的桥,是8组数据(不含因变量=1的组),
1.全部参与建模?
2.还是全部丢弃?
3.还是降低要求矮个子里拔将军,找到8组数据里面最接近覆盖的那个,把因变量设置为1然后加入计算.
我想知道一般情况下,采用哪种方式来采集样本?


雷达卡


京公网安备 11010802022788号







