楼主: ckevinit
5995 2

[学习分享] [解惑] R语言Hmisc包中的函数GiniMD的意义及其应用 [推广有奖]

  • 3关注
  • 7粉丝

已卖:1486份资源

博士生

93%

还不是VIP/贵宾

-

威望
0
论坛币
29907 个
通用积分
180.4567
学术水平
26 点
热心指数
17 点
信用等级
11 点
经验
41199 点
帖子
133
精华
0
在线时间
593 小时
注册时间
2018-1-24
最后登录
2025-12-1

楼主
ckevinit 发表于 2018-6-1 23:10:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
GiniMD(x)是R语言Hmisc包中的一个函数,计算的是一个数值型向量两两元素之间距离的平均值。
最初这个指标是从describe()这个描述性统计函数的output中看到的,于是深究了一番,帮助文档中给出了一些解释,最核心的就是这句话:

This index is defined as the mean absolute difference between any two distinct elements of a vector.





尽管给出了公式定义,但是总是跟我手算的办法(见如下我自己手算的示例)得到的结果不一样。如果不去纠结于复杂的公式,实际中我们可以不管,直接用R里的这个函数求得即可,但问题在于:
1)这个“基尼平均距离”指数(注:这是我对GMD的翻译)有什么意义?
2)GMD指数可以有哪些应用?


多番琢磨和查阅资料,百思不得其解。因此拿出来供大家讨论,请高人指点一二,谢谢。

附一:GMD在R帮助文档中的解释
Gini's Mean Difference
Description

[size=13.333333015441895px]GiniMD computes Gini's mean difference on a numeric vector. This index is defined as the mean absolute difference between any two distinct elements of a vector. For a Bernoulli (binary) variable with proportion of ones equal to p and sample size n, Gini's mean difference is 2np(1-p)/(n-1). For a trinomial variable (e.g., predicted values for a 3-level categorical predictor using two dummy variables) having (predicted) values A, B, C with corresponding proportions a, b, c, Gini's mean difference is 2n[ab|A-B|+ac|A-C|+bc|B-C|]/(n-1).


Usage
GiniMd(x, na.rm=FALSE)
Arguments

x

a numeric vector (for GiniMd)

na.rm

set to TRUE if you suspect there may be NAs in x; these will then be removed. Otherwise an error will result.


Value

[size=13.333333015441895px]a scalar numeric





附二:手算GMD指数的示例

Gmd



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:描述性统计 统计函数 公式定义 平均距离 查阅资料 GMD指数 describe函数

回帖推荐

danbaidong 发表于3楼  查看完整内容

基尼均差是对随机变量X所有可能观测值的绝对离差所做的平均,因此度量了分布的离散程度。其与方差的区别在于方差是对离差取平方运算,而基尼均差是取绝对值运算。

沙发
ckevinit 发表于 2018-6-4 09:39:04
这个问题太难了吗?没有一个人回帖?

藤椅
danbaidong 学生认证  发表于 2019-6-5 17:00:28
基尼均差是对随机变量X所有可能观测值的绝对离差所做的平均,因此度量了分布的离散程度。其与方差的区别在于方差是对离差取平方运算,而基尼均差是取绝对值运算。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-31 11:31