楼主: dale1001
2554 2

[问答] 怎样对数据double sort处理?求大神指教 [推广有奖]

  • 0关注
  • 0粉丝

大专生

38%

还不是VIP/贵宾

-

威望
0
论坛币
719 个
通用积分
0.0029
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
362 点
帖子
8
精华
0
在线时间
88 小时
注册时间
2017-3-11
最后登录
2020-9-4

楼主
dale1001 发表于 2018-11-22 19:16:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
类似FAMA模型的factor构建

code

date

closeb

close

MV

pe

epreturn
000001.SZ1999012.89882.82462245522742129.37860.034038382-0.025596799
000001.SZ1999022.82462.65282108960198027.59190.03624252-0.060822771
000001.SZ1999032.65282.67242124478668927.7950.0359776940.00738842
data 数据大概是这样
要求先将数据按日期分组,
然后对每个日期组内的数据按ep排序分为最小30%G组,中间40%M组,最大30%V组  
然后再将每组内的数据按MV排序分为最大50%B组,最小50%S组
这样分得6组

怎么样可以实现呢?这样分组后又如何调用某一组数据比如调用 所有G组中的B组数据,求其均值
单次分组可以用filter实现,两次分组不太会
求大神解答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
jgchen1966 发表于 2018-11-22 20:28:42
学会 dplyr 包  就会了。。
   

藤椅
elephann 发表于 2018-11-23 16:57:34
加两个辅助变量,size and value,用quantile函数标出30%,40%,30%的组,求交叉组均值,相减。用data.table更快、更简单

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-7 17:46