数据结构请见下图:
rp_entity_id 是代表企业, 数据集中有n多个不同的企业
tc0是一条关于这个企业的财经新闻的发布时间 (比如第一个observation时间是2007年1月1日06:06)
td1是一条关于这个企业的财经新闻的发布日期(比如第一个observation时间是2007年1月1日)
css是这条新闻对于企业的的评价分数sentiment score
-------------------------------------------------
1) 我想计算的一组变量:AveCss1h 代表以当前新闻发布时间为起点,此后forward第一个小时之内所有新闻的sentiment scores的平均值。AveCss2h,AveCss3h...AveCssnh以此类推为forward第二,第三,直到第n个小时之内每小时所有新闻的sentiment scores的平均值。
(比如,2007年1月1日06:06, forward第一小时是06:06-07:06,forward第二个小时是07:06-08:06)
1) 我想计算的另一组变量:AveCss1d 代表以当前新闻发布时间为起点,此后forward第一天之内所有新闻的sentiment scores的平均值。AveCss2d,AveCss3d...AveCssnd以此类推为forward第二,第三,直到第n天之内每天所有新闻的sentiment scores的平均值。(比如,2007年1月1日,forward第一天是1月1日-1月2日,forward第二天是1月2日-1月3日)
----------------------------------------------------
请教各位这个rolling forward average应当怎样编程。万分感谢!