张老师:
现由基层单位报上来数据7000多条,需要对其分析。但发现用logistic回归分析的5个重要变量,不是这缺就是那缺,而主要是两个连续性变量的数据缺失,5个变量全有的数据仅4000条。我现在考虑有三个方法:1.只用完整数据,对其logistic回归分析,2.经过little检验,用EM法对缺失数据填补,再用Logistic回归分析。3.对7000条数据的某些变量进行单因素分析,再对完整数据进行Logistic 回归分析。想问你的问题:1.三种办法选择哪种好?2.如果仅对完整数据分析,专家问起来缺失的问题,如何解释回答才好?不是完全随机分析,怎么代表7000条的真实结果(7000条也不是随机抽的,只是按要求体检结果抽出来报送的),谢谢!