我选的是日交易文件,变量有股票stk,交易量vol,回报率ret,区间interval,天yy等。。把所有数据按时间顺序每51天分成一个区间,yy按照1,2,3,。。。51标了号。一共用50个interval。
每个区间最后一天,如果一只股票的交易量是前50天交易量的top 10%,则定义为大交易量,vol我就记成3.小交易量我就记成1. 投资组合建立好之后,在下一个区间进行检验,看大交易量的投资组合第1,10,20,30,50天的累积回报率。
当在建立好投资组合之后,下一个区间每只股票每天的累积回报率的值我也算出来了,只是不知道怎么挑出大交易量投资组合的股票,只计算这部分的平均回报率。也就是如何在test period中,按照上一个区间第51天分组情况来选数据。
我的数据是有间隔的,比如一只股票可能只在1,3,10,20,50,51交易。
啊,终于说完我的问题了。。。自己想了办法解决,但是发现很多不该出现的缺失值。还靠各位大神来指点呀