7639 15

关于生存分析做预测时的左删失问题 [推广有奖]

11
zabbyy 发表于 2016-5-4 10:30:07 |只看作者 |坛友微信交流群
mingfeng07 发表于 2015-6-21 13:31
生存分析教材里面应该有关于左删失数据如何转化为其它类型的方式吧,我记得我看过的,不过具体细节不太记得 ...
可否推荐是哪一本教材啊  O(∩_∩)O谢谢

使用道具

12
runman 发表于 2016-6-16 22:04:46 |只看作者 |坛友微信交流群
你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做实证分析。

比如 variable1  它所描述的数据为1970-2015的时间序列数据
     variable2  它所描述的数据为2000-2010年的平均值
     variable3  ......
     variable4  ......

     实在想不通它的数据结构是什么样子的?

是不是以下这种形式呢?先谢谢啦。

year   variable1               varible2    variable3   variable4  ...
1970        数值                 缺失        ...         ...
1971        数值                 缺失
1972        数值                 缺失
1973        数值                 缺失
1974        数值                 缺失
1975        数值                 缺失
1976        数值                 缺失
1977        数值                 缺失
1978        数值                 缺失
…         …                  …
2000        数值        2000-2015年变量2的平均值
2001        数值        2000-2015年变量2的平均值
2002        数值        2000-2015年变量2的平均值
2003        数值        2000-2015年变量2的平均值
2004        数值        2000-2015年变量2的平均值
2005        数值        2000-2015年变量2的平均值
2006        数值        2000-2015年变量2的平均值
2007        数值        2000-2015年变量2的平均值
2008        数值        2000-2015年变量2的平均值
2009        数值        2000-2015年变量2的平均值
2010        数值        2000-2015年变量2的平均值
2011        数值        2000-2015年变量2的平均值
2012        数值        2000-2015年变量2的平均值
2013        数值        2000-2015年变量2的平均值
2014        数值        2000-2015年变量2的平均值
2015        数值        2000-2015年变量2的平均值

使用道具

13
runman 发表于 2016-6-16 22:05:33 |只看作者 |坛友微信交流群
慕白__·__慕思 发表于 2015-6-19 10:59
用cox模型试一下,proc phreg
你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做实证分析。

比如 variable1  它所描述的数据为1970-2015的时间序列数据
     variable2  它所描述的数据为2000-2010年的平均值
     variable3  ......
     variable4  ......

     实在想不通它的数据结构是什么样子的?

是不是以下这种形式呢?先谢谢啦。

year   variable1               varible2    variable3   variable4  ...
1970        数值                 缺失        ...         ...
1971        数值                 缺失
1972        数值                 缺失
1973        数值                 缺失
1974        数值                 缺失
1975        数值                 缺失
1976        数值                 缺失
1977        数值                 缺失
1978        数值                 缺失
…         …                  …
2000        数值        2000-2015年变量2的平均值
2001        数值        2000-2015年变量2的平均值
2002        数值        2000-2015年变量2的平均值
2003        数值        2000-2015年变量2的平均值
2004        数值        2000-2015年变量2的平均值
2005        数值        2000-2015年变量2的平均值
2006        数值        2000-2015年变量2的平均值
2007        数值        2000-2015年变量2的平均值
2008        数值        2000-2015年变量2的平均值
2009        数值        2000-2015年变量2的平均值
2010        数值        2000-2015年变量2的平均值
2011        数值        2000-2015年变量2的平均值
2012        数值        2000-2015年变量2的平均值
2013        数值        2000-2015年变量2的平均值
2014        数值        2000-2015年变量2的平均值
2015        数值        2000-2015年变量2的平均值

使用道具

14
runman 发表于 2016-6-16 22:05:58 |只看作者 |坛友微信交流群
bridge1989 发表于 2015-6-19 14:38
那要看看你是怎么定义C这个变量 以及其中的1所指的具体含义
你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做实证分析。

比如 variable1  它所描述的数据为1970-2015的时间序列数据
     variable2  它所描述的数据为2000-2010年的平均值
     variable3  ......
     variable4  ......

     实在想不通它的数据结构是什么样子的?

是不是以下这种形式呢?先谢谢啦。

year   variable1               varible2    variable3   variable4  ...
1970        数值                 缺失        ...         ...
1971        数值                 缺失
1972        数值                 缺失
1973        数值                 缺失
1974        数值                 缺失
1975        数值                 缺失
1976        数值                 缺失
1977        数值                 缺失
1978        数值                 缺失
…         …                  …
2000        数值        2000-2015年变量2的平均值
2001        数值        2000-2015年变量2的平均值
2002        数值        2000-2015年变量2的平均值
2003        数值        2000-2015年变量2的平均值
2004        数值        2000-2015年变量2的平均值
2005        数值        2000-2015年变量2的平均值
2006        数值        2000-2015年变量2的平均值
2007        数值        2000-2015年变量2的平均值
2008        数值        2000-2015年变量2的平均值
2009        数值        2000-2015年变量2的平均值
2010        数值        2000-2015年变量2的平均值
2011        数值        2000-2015年变量2的平均值
2012        数值        2000-2015年变量2的平均值
2013        数值        2000-2015年变量2的平均值
2014        数值        2000-2015年变量2的平均值
2015        数值        2000-2015年变量2的平均值

使用道具

15
runman 发表于 2016-6-16 22:06:23 |只看作者 |坛友微信交流群
jingju11 发表于 2015-6-19 23:56
For left censored data, you need to have special input data. For example,
you need to use counting  ...
你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做实证分析。

比如 variable1  它所描述的数据为1970-2015的时间序列数据
     variable2  它所描述的数据为2000-2010年的平均值
     variable3  ......
     variable4  ......

     实在想不通它的数据结构是什么样子的?

是不是以下这种形式呢?先谢谢啦。

year   variable1               varible2    variable3   variable4  ...
1970        数值                 缺失        ...         ...
1971        数值                 缺失
1972        数值                 缺失
1973        数值                 缺失
1974        数值                 缺失
1975        数值                 缺失
1976        数值                 缺失
1977        数值                 缺失
1978        数值                 缺失
…         …                  …
2000        数值        2000-2015年变量2的平均值
2001        数值        2000-2015年变量2的平均值
2002        数值        2000-2015年变量2的平均值
2003        数值        2000-2015年变量2的平均值
2004        数值        2000-2015年变量2的平均值
2005        数值        2000-2015年变量2的平均值
2006        数值        2000-2015年变量2的平均值
2007        数值        2000-2015年变量2的平均值
2008        数值        2000-2015年变量2的平均值
2009        数值        2000-2015年变量2的平均值
2010        数值        2000-2015年变量2的平均值
2011        数值        2000-2015年变量2的平均值
2012        数值        2000-2015年变量2的平均值
2013        数值        2000-2015年变量2的平均值
2014        数值        2000-2015年变量2的平均值
2015        数值        2000-2015年变量2的平均值

使用道具

16
Double君 发表于 2017-11-7 14:35:45 |只看作者 |坛友微信交流群
请问研究左删失数据的现实意义有哪些,或者可以应用于哪些方面

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 08:42