我有大约40m的数据样本,每行数据有包括时间(日),股票代码,流通市值,价格等18个属性。
现在需要在数据上计算,将每天的股票进行分类:
1、按照规模分类:将股票按照每天流通市值排序后等分成小盘股、中盘股、大盘股三类。
2、按照价格分类:将股票价格前收盘价从小到大排列,然后等比例分成低价股、中价股、高价股三类。
3、按照业绩分类:将股价按上年度的每股收益率(每股收益除以平均股价)从小到大排序后,将小于零的归为负业绩类,大于零的按照30%、70%的比例分成低、中、高3类。
4、按照市盈率分类:将年度内的前一交易日市盈率从小到大排序后按30%、70%的比例分成低、中、高和其他共4类,其中其他类是指市盈率为负或者市盈率缺失的股票。
5、对ST股票的持股:将股票分为ST股票和非ST股票两类。
就是说,首先按照时间(有半年)分类,然后对每天的情况,按照流通市值,价格和业绩等排序再分类,分别赋一个值1,2或者3(按照排位在前 中 后的位置,例如 深发展A在2009年6月4日流通市值排在1/3,则给2009年6月4日的深发展A赋予一个新的属性1,名称为流通市值排名,其他的类似。
因为样本太大,用其他软件没法进行运算,只能求助SAS,但是我本人对SAS一点了解都没有,所以求教一下大家!
谢谢!



雷达卡



京公网安备 11010802022788号







