楼主: ydwkiller
3400 3

[原创博文] 【求教】如何对一个大样本数据进行排序 [推广有奖]

  • 0关注
  • 0粉丝

小学生

14%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
30 点
帖子
1
精华
0
在线时间
8 小时
注册时间
2010-12-8
最后登录
2011-1-12

楼主
ydwkiller 发表于 2010-12-16 11:20:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求教高手:

我有大约40m的数据样本,每行数据有包括时间(日),股票代码,流通市值,价格等18个属性。


现在需要在数据上计算,将每天的股票进行分类:
1、按照规模分类:将股票按照每天流通市值排序后等分成小盘股、中盘股、大盘股三类。
2、按照价格分类:将股票价格前收盘价从小到大排列,然后等比例分成低价股、中价股、高价股三类。
3、按照业绩分类:将股价按上年度的每股收益率(每股收益除以平均股价)从小到大排序后,将小于零的归为负业绩类,大于零的按照30%70%的比例分成低、中、高3类。
4、按照市盈率分类:将年度内的前一交易日市盈率从小到大排序后按30%70%的比例分成低、中、高和其他共4类,其中其他类是指市盈率为负或者市盈率缺失的股票。
5、对ST股票的持股:将股票分为ST股票和非ST股票两类。

就是说,首先按照时间(有半年)分类,然后对每天的情况,按照流通市值,价格和业绩等排序再分类,分别赋一个值1,2或者3(按照排位在前 中 后的位置,例如 深发展A在2009年6月4日流通市值排在1/3,则给2009年6月4日的深发展A赋予一个新的属性1,名称为流通市值排名,其他的类似。

因为样本太大,用其他软件没法进行运算,只能求助SAS,但是我本人对SAS一点了解都没有,所以求教一下大家!

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:样本数据 样本数 大样本 ST股票 从小到大 股票价格 股票代码 市盈率 收益率 大盘股

沙发
zc.1984 发表于 2010-12-16 13:08:13
这样说太抽象,在数据上说比较好明白!

藤椅
论坛数据分析 发表于 2010-12-16 13:49:43
不用排序
用proc  univariate计算一下百分位数即可。然后根据百分位数进行变量各个层次的分组
老夫聊发少年狂

板凳
论坛数据分析 发表于 2010-12-16 13:52:34
对SAS来说这个样本量不算大样本,还不比考虑效率和空间问题
老夫聊发少年狂

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 19:44