楼主,你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做实证分析。
比如 variable1 它所描述的数据为1970-2015的时间序列数据
variable2 它所描述的数据为2000-2010年的平均值
variable3 ......
variable4 ......
实在想不通它的数据结构是什么样子的?
是不是以下这种形式呢?先谢谢啦。
year variable1 varible2 variable3 variable4 ...
1970 数值 缺失 ... ...
1971 数值 缺失
1972 数值 缺失
1973 数值 缺失
1974 数值 缺失
1975 数值 缺失
1976 数值 缺失
1977 数值 缺失
1978 数值 缺失
… … …
2000 数值 2000-2015年变量2的平均值
2001 数值 2000-2015年变量2的平均值
2002 数值 2000-2015年变量2的平均值
2003 数值 2000-2015年变量2的平均值
2004 数值 2000-2015年变量2的平均值
2005 数值 2000-2015年变量2的平均值
2006 数值 2000-2015年变量2的平均值
2007 数值 2000-2015年变量2的平均值
2008 数值 2000-2015年变量2的平均值
2009 数值 2000-2015年变量2的平均值
2010 数值 2000-2015年变量2的平均值
2011 数值 2000-2015年变量2的平均值
2012 数值 2000-2015年变量2的平均值
2013 数值 2000-2015年变量2的平均值
2014 数值 2000-2015年变量2的平均值
2015 数值 2000-2015年变量2的平均值
|