6553 15

[问答] 均值比较的问题 [推广有奖]

11
wtxhpx1991 在职认证  发表于 2013-2-17 16:55:11
落木萧萧下0921 发表于 2013-2-16 19:22
呵呵,谢谢楼主的建议。我昨天看了不少资料,我也觉得用均值加减标准差这种方式不好。均值小于标准差,相 ...
不客气~~我觉得实在不行极值部分用广义帕累托分布拟合下也可以。不过个人认为非参的方法更好一些

12
jswu167 企业认证  发表于 2013-2-17 17:00:39
交流的挺热烈

13
smile108 发表于 2013-2-17 19:10:50
落木萧萧下0921 发表于 2013-2-16 18:59
1. 删除小于10平方米(0.001公顷)面积的原因:第一,数据是工商业用地面积大小,而从实际出发,对于小于 ...
看完你的数据发现绝大部分数据确实都集中在10公顷以内,那此种分类方法确实要调整。建议:1如你说的那些远远超过平均值的数据(如>1000),可以将其看成异常值直接删除掉,然后调整横坐标数据的范围(比如将数据缩小至30公顷以内,这样也便于发现数据的分布等特征)。2考虑将数据分成两部分,较小的数据做一个图,较大的数据做一个图,分别对比(即找一个数据截断点)。3考虑截尾分布等(如帕累托分布)4将数据做不同的变换(主要是你的数据变化范围太大,这样可以缩小范围),如平常的常用对数、自然对数变化(甚至可以把对数中的底数在调大一些),然后去拟合数据满足的分布类型。
    实在不行,还是和老师多商量吧,加油!

14
落木萧萧下0921 发表于 2013-2-19 20:06:33
IntheRed 发表于 2013-2-17 03:22
从你贴的直方图看,很像指数分布啊,可以考虑指数或Gamma distribution(指数本来就是Gamma的特例)。 log  ...
我用了以10为底和自然数为底的转换法,转换后又做了一个正态性检验,还是不呈正态分布啊?请问,怎么办啊?555,老师让我基于正态分布作图。

15
IntheRed 发表于 2013-2-19 23:05:23
落木萧萧下0921 发表于 2013-2-19 20:06
我用了以10为底和自然数为底的转换法,转换后又做了一个正态性检验,还是不呈正态分布啊?请问,怎么办啊 ...
和normal 相差多少呢?检验的结论主要差别在哪里?
不太明白你们老师为什么一定要用normal,有什么理论支持这个分布是normal 吗?
20多万工商业用地面积数据的来源是什么? 都是同一年,或同一时期的数据? 行业,地区会对用地面积有影响吗? 类似的问题考虑过吗?
问这些问题,是觉得对整个dataset 的normal 或 lognormal fit 不好,可以考虑把data 分类,再fit。

16
奔跑的鸟儿 发表于 2013-2-20 09:10:30

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-22 22:11