[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]新发布的2019数据求助,有没有大神了解呀T.T
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]问题一,如何在2019年individual数据中区分用户是追访还是新访?
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]1) 之前的2017年数据中有一个变量 - track可区分追访和新访用户,2019数据中是否有相同的变量?在2019年的数据当中我暂时没有找到这个变量。
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]2) 如果用2019开头的hhid进行追访和新访用户区分,是否准确?
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]3) 又或,请问把A1106(原家庭成员确认)变量答案为缺失的用户视为新访用户是否准确?
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]问题二,在2019年的household数据中,住房价值相关变量(即c2016开头的那些变量)缺失值是否异常?比如,
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]4)按照hhid为2019开头的标准定义新追访用户,那么仅有4个新追访用户的住房价值变量 c2016_1有值。请问这里是数据是否存在异常?
[color=rgb(32, 33, 36) !important][backcolor=rgb(248, 248, 248) !important]5)从2019年的household全部数据上看,变量 c2016_2_imp有32,549/34,643个缺失值,c2016_3_imp则全部为缺失值。请问这里是数据是否存在异常?


雷达卡


京公网安备 11010802022788号







