楼主: 爱我别走ASD
3863 9

[统计软件] 对于大批量的数据如何方便得用离散分布表示? [推广有奖]

  • 1关注
  • 6粉丝

博士生

51%

还不是VIP/贵宾

-

TA的文库  其他...

统计学资料

威望
0
论坛币
30602 个
通用积分
5.1418
学术水平
22 点
热心指数
26 点
信用等级
15 点
经验
653 点
帖子
179
精华
0
在线时间
305 小时
注册时间
2013-8-31
最后登录
2019-10-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
楼主有一千五的离散样本数据,用软件拟合后发现没有理论分布能够比较好地表示这组数据,于是采用离散分布,但问题是样本数据量过大,不好表示啊。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大批量 分布表 样本数据 样本数 如何

已有 1 人评分经验 学术水平 热心指数 收起 理由
yangyuzhou + 40 + 1 + 1 鼓励积极发帖讨论

总评分: 经验 + 40  学术水平 + 1  热心指数 + 1   查看全部评分

沙发
hyu9910 在职认证  发表于 2014-3-30 18:23:20 |只看作者 |坛友微信交流群
最简单直方图

使用道具

藤椅
爱我别走ASD 发表于 2014-3-30 20:44:00 |只看作者 |坛友微信交流群
这么说吧,我需要的不是用图表来表现。

使用道具

板凳
cash_king01 发表于 2014-4-1 14:43:22 |只看作者 |坛友微信交流群
不知你搜集的数据对应的变量是什么。我认为如果变量性质上是离散的(例如:人的性别,或者债券的评级),才会用到离散型的分布。否则,只能用连续分布。
1500个样本数据量用于拟合总体的分布应足够了,很奇怪竟没有任何理论分布能够较好地拟合?如果用观察一下数据直方图的话,就应当有一个大方向上的看法了。
已有 1 人评分论坛币 收起 理由
chenyi112982 + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

使用道具

cash_king01 发表于 2014-4-1 14:43
不知你搜集的数据对应的变量是什么。我认为如果变量性质上是离散的(例如:人的性别,或者债券的评级),才 ...
卡方检验和K S检验的P值都小于0.01,采用过几款软件进行拟合,效果都不好

使用道具

地板
cash_king01 发表于 2014-4-1 16:08:42 |只看作者 |坛友微信交流群
爱我别走ASD 发表于 2014-4-1 15:35
卡方检验和K S检验的P值都小于0.01,采用过几款软件进行拟合,效果都不好
我不懂统计软件,也不懂拟合的检验标准。但我理解将样本数据拟合于一个既定的理论分布这样的工作,实际上是一个纯技术问题(仅仅是你对变量实际分布的一种猜测,而并非该变量的真实分布。社会科学中各类变量的真实分布我们无从得知)。
我想拟合工作中的一个关键是合理选择你要拟合的理论分布的参数。例如:如果从样本看来,你猜测变量符合正态分布,那么你需要为该正态分布选择合适的μ和σ,否则拟合度不会太高。

使用道具

7
imwei 发表于 2014-4-1 16:10:50 |只看作者 |坛友微信交流群
可以用minitab软件不?

使用道具

8
爱我别走ASD 发表于 2014-4-1 19:03:34 |只看作者 |坛友微信交流群
cash_king01 发表于 2014-4-1 16:08
我不懂统计软件,也不懂拟合的检验标准。但我理解将样本数据拟合于一个既定的理论分布这样的工作,实际上 ...
基本不在点上,抱歉。

使用道具

9
cash_king01 发表于 2014-4-9 16:53:49 |只看作者 |坛友微信交流群
爱我别走ASD 发表于 2014-4-1 19:03
基本不在点上,抱歉。
查了一下,对于分布的拟合度,chi方和k-s的确是常用统计检验方式。如果现有分布拟合的结果都不理想,只能用描述统计了(期望、方差、skewness, kurtosis...)

使用道具

10
爱我别走ASD 发表于 2014-4-10 09:09:54 |只看作者 |坛友微信交流群
cash_king01 发表于 2014-4-9 16:53
查了一下,对于分布的拟合度,chi方和k-s的确是常用统计检验方式。如果现有分布拟合的结果都不理想,只能 ...
我在做系统仿真,如果使用描述统计,我的数据就无法输入到模型中,我需要的不是自己怎么去描述这组数据,而是让电脑能够识别,因为需要拟合成某种分布。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 20:54