非平衡数据如下:
obs id year region edu y yy
1 1 2000 1 1 1 1
2 1 2001 1 1 3 5
3 2 2001 1 1 2 5
4 2 2002 1 1 4 4
5 3 2002 2 2 3 11
6 3 2003 2 2 7 9
7 4 2000 2 2 4
8 4 2001 2 2 7 12
9 4 2002 2 2 9 11
10 5 2001 1 2 11 5
11 5 2002 1 2 9 4
12 6 2000 3 1 3 3
13 6 2001 3 1 4 4
14 6 2002 3 1 5 5
15 7 2001 2 1 12 12
16 7 2002 2 1 11 11
17 7 2003 2 1 9 9
...
其中id是个体代码,region是区域,edu代表小学、中学和大学的变量,其中edu=1代表大学,y是收入,求yy,代表各年份各地区有大学文化的个体总收入。例如,第5个(obs=5)的观测值,代表的是在2002年地区2具有中学文化水平(edu=2)的个体,yy的值应当是参考obs=16的yy值,即yy=16,也就是虽然第5个观测值是具有中学文化,但所在的年份(2002年)和区域(region=2)大学文化的个体总收入是16,请问如何求yy值?谢谢!