xts1xts 发表于 2011-6-8 13:20 vltyear这个数据,就是从国泰君安的数据库中下载的,关于每家上市公司存在违规行为情况的统计,即违规的公司的代码、违规行为发生的年份。这么说能清楚一些吗?或者,你的疑问具体是什么呢?
vltyear这个变量不需要是年份,只要是一个哑元即可。若某公司在某一年违规,则vltyear=1(否则=0)即可。
现在vltyear中虽然列出了违规年份,但对于某公司而言,为什么要这么列呢?简单说,year的观测值与vltyear的观测值究竟是什么关系?
以dm==11为例。
dm year vltyear province
11 1992 1994 广东
11 1993 1994 广东
11 1994 1994 广东
11 1995 1994 广东
11 1996 1994 广东
11 1997 1999 广东
11 1998 1999 广东
11 1999 1999 广东
11 2000 1999 广东
11 2001 1999 广东
11 2002 2000 广东
从中可以看出,该公司有3个年份违规。那么,vltyear可不可以列成如下呢:
11 1992 1994 广东
11 1993 1999 广东
11 1994 2000 广东
11 1995 1994 广东
11 1996 1999 广东
11 1997 2000 广东
11 1998 1994 广东
11 1999 1999 广东
11 2000 2000 广东
11 2001 1994 广东
11 2002 1999 广东