楼主: 我隐身啦
12346 23

[问答] R语言分组计算 [推广有奖]

11
我隐身啦 发表于 2015-12-18 11:18:07
suimong 发表于 2015-12-18 08:43
那要看你准备把多出来的一行或几行放到第几组去了?这个是你的分析逻辑决定的
可是要怎么决定啊?好像没有选择的地方啊。

12
suimong 发表于 2015-12-18 12:30:22
我隐身啦 发表于 2015-12-18 11:18
可是要怎么决定啊?好像没有选择的地方啊。
这个是看你做数据分析的目的是什么,和R没有关系了。只有你知道为什么要对数据进行分组计算,所以你也自然要考虑不能等分的情况下怎么处理最合适。

13
我隐身啦 发表于 2015-12-18 12:36:21
suimong 发表于 2015-12-18 12:30
这个是看你做数据分析的目的是什么,和R没有关系了。只有你知道为什么要对数据进行分组计算,所以你也自然 ...
可是用stata中的group(10),就可以分10组,如果多一行好像就随机有一组多一行。但是用R这样做就报错进行不下去了啊。

14
suimong 发表于 2015-12-18 12:48:04
随机分的话对于你数据分析来说不见得是好事情吧?你如果多了9行呢?这9行是自成一组呢,还是全扔进最后一组呢,还是平均分给之前的组呢?平均分是怎么分?是开头的九组还是最后九组每组多一行呢?不同的分析目的会导致不同的分法,最后产生的结果也是不尽相同的。R和Stata并不能帮你决定怎么分析数据。
你可以写清楚你的数据有几行,多出来的行怎么分,然后我可以把代码怎么写告诉你

15
我隐身啦 发表于 2015-12-18 22:35:53 来自手机
suimong 发表于 2015-12-18 12:48
随机分的话对于你数据分析来说不见得是好事情吧?你如果多了9行呢?这9行是自成一组呢,还是全扔进最后一组 ...
非常感谢你。我之前以为随机分的,以为这不会有太大影响,没想到每个分法还有不同的影响,还有不同的代码。那我再看看,如果有什么问题希望能再向你请教,非常感谢你。

16
我隐身啦 发表于 2015-12-21 20:55:07
suimong 发表于 2015-12-18 00:41
你是要按数量等分啊,我以为你是要按区间大小等分。那你就连cut函数都不需要了,直接生成一个和你的data  ...
你好,最近经常遇到分组的问题,比如我的data frame有21649行,我想分成3组,多出来的一行放到最后一组,代码该怎么写?还是用sort吗?
如果我还想把这21649行分成5组,多出来的四行平均分到后面四组,代码又该怎么写?
希望能得到你的解答,谢谢。

17
suimong 发表于 2015-12-22 01:15:48
我隐身啦 发表于 2015-12-21 20:55
你好,最近经常遇到分组的问题,比如我的data frame有21649行,我想分成3组,多出来的一行放到最后一组, ...
  1. generate_group <- function(nrows,
  2.                            ngroups,
  3.                            methods = c("在开头平均分配",
  4.                                        "在末尾平均分配",
  5.                                        "第一组",
  6.                                        "最后一组")) {
  7.   base <- rep(seq_len(ngroups), nrows %/% ngroups)
  8.   ngroups_left <- nrows %% ngroups
  9.   
  10.   switch(methods,
  11.          "在开头平均分配" = sort(c(base, seq(from = 1, length.out = ngroups_left))),
  12.          "在末尾平均分配" = sort(c(base, seq(to = ngroups, length.out = ngroups_left))),
  13.          "第一组" = sort(c(base, rep(1, ngroups_left))),
  14.          "最后一组" = sort(c(base, rep(ngroups, ngroups_left))))
  15. }

  16. # Test
  17. generate_group(19, 5, "在开头平均分配")
  18. generate_group(19, 5, "在末尾平均分配")
  19. generate_group(19, 5, "第一组")
  20. generate_group(19, 5, "最后一组")
复制代码


18
我隐身啦 发表于 2015-12-22 14:12:11
suimong 发表于 2015-12-22 01:15
太谢谢了

19
我隐身啦 发表于 2015-12-23 11:27:31
suimong 发表于 2015-12-22 01:15
你好,不好意思打扰了,还有个问题向你请教。
我要求实际资本结构和目标资本结构的偏离程度。现在我有了实际的资本结构,我想知道目标的资本结构,影响目标资本结构的变量我都有了。要求出目标资本结构的拟合值,我才能知道实际资本结构与目标资本结构偏离的程度。怎么求目标资本结构的拟合值?
我看有的用广义线性模型( GLM) 的ogit 最大似然估计( logit QMLE) 方法进行参数估计,有的用先求初始值再用非线性模型进行估计,有的用广义矩估计(GMM)。
这些是都可以吗?该用哪种?R语言的代码方便告知一下吗?非常感谢。

20
我隐身啦 发表于 2015-12-23 11:27:38
suimong 发表于 2015-12-22 01:15
你好,不好意思打扰了,还有个问题向你请教。
我要求实际资本结构和目标资本结构的偏离程度。现在我有了实际的资本结构,我想知道目标的资本结构,影响目标资本结构的变量我都有了。要求出目标资本结构的拟合值,我才能知道实际资本结构与目标资本结构偏离的程度。怎么求目标资本结构的拟合值?
我看有的用广义线性模型( GLM) 的ogit 最大似然估计( logit QMLE) 方法进行参数估计,有的用先求初始值再用非线性模型进行估计,有的用广义矩估计(GMM)。
这些是都可以吗?该用哪种?R语言的代码方便告知一下吗?非常感谢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 03:09