2371 0

[求助成功] Truncated data and Censored data [推广有奖]

  • 0关注
  • 6粉丝

博士生

79%

还不是VIP/贵宾

-

威望
0
论坛币
3243 个
通用积分
219.4205
学术水平
24 点
热心指数
25 点
信用等级
17 点
经验
4265 点
帖子
179
精华
0
在线时间
536 小时
注册时间
2016-9-10
最后登录
2022-8-19

楼主
呼呼兔的胡图图 学生认证  发表于 2019-5-10 00:28:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
说明:
1.以下内容基本上是当时计量老师王老师汇总的成果。
2.可参考书籍是 Limited-dependent and qualitative variables in econometrics (G.S. Maddala, 1983) Ch.1 & Ch.6

1) Truncated data: some responses are truncated and will not enter the database.
Censored data: some responses are ccensored and will not reveal the full information.
所以,两者的区别之一是数据库中是否有这个数据,truncated data 没有进入数据库中,也就是没有成为你的观测值;censored data 中有这个观测值,但是因为有上/下限问题不能全部表示出来。
2) 例子:
Truncated data:书中举了一个例子 negative income tax 也就是政府向贫困线(假设是50,000元)以下的人或家庭提供收入资助,所以如果当局想要了解接受资助的家庭对该计划的满意度,那么年收入在50,000元以上的人就会被truncated掉,他们没有进入调查中,数据库中没有他们的资料。反之,举一个没有被完全truncated的例子,比如美国的财税资料库,美国公民需要报税,基本上政府掌握的收入资料是完整的。但是也不是完全完整,因为也存在一些不报税(拾荒老人)或者避税(非常有钱的人)的情况。
Censored data: 比如一个药品上市之前进行实验,假设实验周期是5年,如果接受实验的人在第2年去世,则不算是censored data,但是如果在5年零1天去世了,他/她的数据就会成为censored data。因为我们无法看到在调查周期以外的状况。另一个更简单的例子,我们考试的成绩最高分是100分,超过100分的就被censored 掉,因为有些同学知识掌握程度可能是超过100分的,但是上限在这里。我们无法比较出3个同时获得100分同学谁掌握的知识更牢固。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 17:06