楼主: 凭雨听风
1991 2

[数据管理求助] Unknown数据处理问题 [推广有奖]

  • 5关注
  • 10粉丝

VIP

点此得金币

已卖:1份资源

副教授

25%

还不是VIP/贵宾

-

TA的文库  其他...

会计神级资料

威望
1
论坛币
46776 个
通用积分
5068.4292
学术水平
63 点
热心指数
91 点
信用等级
61 点
经验
24284 点
帖子
541
精华
0
在线时间
443 小时
注册时间
2012-7-18
最后登录
2025-9-16

楼主
凭雨听风 发表于 2014-2-26 08:37:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现在在做卫生经济方向的论文 遇到一个问题 在一个样本总量80000的样本里 有多个和病因相关的变量 都是问卷形式回答 yes no 或者 unknown 我想做一个ordered probit回归 以这些病因变量为自变量 但是每个病因变量的Unknown比例太大 少则10% 多则98% 不知该如何处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:UNKNOWN 数据处理问题 Known Know 数据处理 因变量 自变量 论文 如何 样本

沙发
凭雨听风 发表于 2014-2-26 09:01:11
目前我的想法是
把UNKNOWN数据赋值为0
YES赋值为1
NO赋值为-1
这样不知道是不是可行

藤椅
jjjj6666 发表于 2014-2-26 11:17:07
if the percentage is not high, may consider using imputation approach if the unknown happens randomly.  If the percentage is high, not sure if there is a good approach.  Also, The person who responds may select unknown on purpose, in this case, imputation is also not good since something is hiding in the unknown response.

other people may have better suggestions?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 05:16