问题如下:
源文件写在一个access文件里(已经分类排序),已经导入SAS,现在要在表右方添加两列:
一列名称为行业销售收入占比(share_sales),求出该年各个省份每个行业的每个公司销售收入占全行业的比例。
另一列名称为该行业前两家公司销售收入比例之和(front_2_share_sales),这个变量作为每个公司身处在行业内的竞争程度。
数据量很大,有近百万。
year address industry company sales share_sales front2_share_sales
1996 01 001 xxxx1 5
1996 01 001 xxxx2 4
1996 01 001 xxxx3 3
1996 01 002 xxxx4 9
1996 01 002 xxxx5 8
1996 01 002 xxxx6 7
1996 02 001 xxxx7 10
1996 02 001 xxxx8 6
1996 02 001 xxxx9 5
1996 03 ............
................
在没有分组的情况下求比例比较简单,但是涉及到了两重分组,所以处理起来没有想出有效的方法,希望高手慷慨解答这个问题,最好写出完整代码,不胜感激。