R语言分组计算 - 第2页

11楼

我隐身啦 发表于 2015-12-18 11:18:07

suimong 发表于 2015-12-18 08:43
那要看你准备把多出来的一行或几行放到第几组去了？这个是你的分析逻辑决定的

可是要怎么决定啊？好像没有选择的地方啊。

12楼

suimong 发表于 2015-12-18 12:30:22

我隐身啦发表于 2015-12-18 11:18
可是要怎么决定啊？好像没有选择的地方啊。

这个是看你做数据分析的目的是什么，和R没有关系了。只有你知道为什么要对数据进行分组计算，所以你也自然要考虑不能等分的情况下怎么处理最合适。

13楼

我隐身啦 发表于 2015-12-18 12:36:21

suimong 发表于 2015-12-18 12:30
这个是看你做数据分析的目的是什么，和R没有关系了。只有你知道为什么要对数据进行分组计算，所以你也自然 ...

可是用stata中的group（10），就可以分10组，如果多一行好像就随机有一组多一行。但是用R这样做就报错进行不下去了啊。

14楼

suimong 发表于 2015-12-18 12:48:04

随机分的话对于你数据分析来说不见得是好事情吧？你如果多了9行呢？这9行是自成一组呢，还是全扔进最后一组呢，还是平均分给之前的组呢？平均分是怎么分？是开头的九组还是最后九组每组多一行呢？不同的分析目的会导致不同的分法，最后产生的结果也是不尽相同的。R和Stata并不能帮你决定怎么分析数据。
你可以写清楚你的数据有几行，多出来的行怎么分，然后我可以把代码怎么写告诉你

15楼

我隐身啦 发表于 2015-12-18 22:35:53 来自手机

suimong 发表于 2015-12-18 12:48
随机分的话对于你数据分析来说不见得是好事情吧？你如果多了9行呢？这9行是自成一组呢，还是全扔进最后一组 ...

非常感谢你。我之前以为随机分的，以为这不会有太大影响，没想到每个分法还有不同的影响，还有不同的代码。那我再看看，如果有什么问题希望能再向你请教，非常感谢你。

16楼

我隐身啦 发表于 2015-12-21 20:55:07

suimong 发表于 2015-12-18 00:41
你是要按数量等分啊，我以为你是要按区间大小等分。那你就连cut函数都不需要了，直接生成一个和你的data ...

你好，最近经常遇到分组的问题，比如我的data frame有21649行，我想分成3组，多出来的一行放到最后一组，代码该怎么写？还是用sort吗？
如果我还想把这21649行分成5组，多出来的四行平均分到后面四组，代码又该怎么写？
希望能得到你的解答，谢谢。

17楼

suimong 发表于 2015-12-22 01:15:48

我隐身啦发表于 2015-12-21 20:55
你好，最近经常遇到分组的问题，比如我的data frame有21649行，我想分成3组，多出来的一行放到最后一组， ...

generate_group <- function(nrows,
ngroups,
methods = c("在开头平均分配",
"在末尾平均分配",
"第一组",
"最后一组")) {
base <- rep(seq_len(ngroups), nrows %/% ngroups)
ngroups_left <- nrows %% ngroups
switch(methods,
"在开头平均分配" = sort(c(base, seq(from = 1, length.out = ngroups_left))),
"在末尾平均分配" = sort(c(base, seq(to = ngroups, length.out = ngroups_left))),
"第一组" = sort(c(base, rep(1, ngroups_left))),
"最后一组" = sort(c(base, rep(ngroups, ngroups_left))))
}
# Test
generate_group(19, 5, "在开头平均分配")
generate_group(19, 5, "在末尾平均分配")
generate_group(19, 5, "第一组")
generate_group(19, 5, "最后一组")

复制代码

18楼

我隐身啦 发表于 2015-12-22 14:12:11

suimong 发表于 2015-12-22 01:15

太谢谢了

19楼

我隐身啦 发表于 2015-12-23 11:27:31

suimong 发表于 2015-12-22 01:15

你好，不好意思打扰了，还有个问题向你请教。
我要求实际资本结构和目标资本结构的偏离程度。现在我有了实际的资本结构，我想知道目标的资本结构，影响目标资本结构的变量我都有了。要求出目标资本结构的拟合值，我才能知道实际资本结构与目标资本结构偏离的程度。怎么求目标资本结构的拟合值？
我看有的用广义线性模型( GLM) 的ogit 最大似然估计( logit QMLE) 方法进行参数估计，有的用先求初始值再用非线性模型进行估计，有的用广义矩估计（GMM）。
这些是都可以吗？该用哪种？R语言的代码方便告知一下吗？非常感谢。

20楼

我隐身啦 发表于 2015-12-23 11:27:38

suimong 发表于 2015-12-22 01:15

你好，不好意思打扰了，还有个问题向你请教。
我要求实际资本结构和目标资本结构的偏离程度。现在我有了实际的资本结构，我想知道目标的资本结构，影响目标资本结构的变量我都有了。要求出目标资本结构的拟合值，我才能知道实际资本结构与目标资本结构偏离的程度。怎么求目标资本结构的拟合值？
我看有的用广义线性模型( GLM) 的ogit 最大似然估计( logit QMLE) 方法进行参数估计，有的用先求初始值再用非线性模型进行估计，有的用广义矩估计（GMM）。
这些是都可以吗？该用哪种？R语言的代码方便告知一下吗？非常感谢。

[问答] R语言分组计算 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群