楼主: 刘坤元_leige
8622 18

[问答] 怎么对我这些数据进行回归分析啊?(毕业论文用、非线性) [推广有奖]

11
刘坤元_leige 发表于 2016-5-16 15:38:22
statsman 发表于 2016-5-16 05:02
先看看你选择的这些变量和因变量有没有关系吧
除了发布时段(相关系数0.038),其它几个自变量都和评论数有相关关系。论坛不能发截图么,传不上来?相关系数0.094(来源网站),0.075(图片),0.334(视频),0.192(正文字数),0.130(标题长度),以及—0.208(句子长度)

12
刘坤元_leige 发表于 2016-5-16 15:38:44
statsman 发表于 2016-5-16 05:02
先看看你选择的这些变量和因变量有没有关系吧
除了发布时段(相关系数0.038),其它几个自变量都和评论数有相关关系。论坛不能发截图么,传不上来?相关系数0.094(来源网站),0.075(图片),0.334(视频),0.192(正文字数),0.130(标题长度),以及—0.208(句子长度)

13
刘坤元_leige 发表于 2016-5-16 15:41:34
星期天的早晨 发表于 2016-5-16 09:26
一个毕业答辩过来人的经验,实证就不说了,有一个问题楼主需要注意,既然是毕业论文,肯定要经过评委老师的 ...
文科专业(传播学)。我大学期间没学过spss。老师们也基本不懂(也有懂得老师)。很多老师是教视觉设计、视频剪辑、新闻写作、动画等方向。所以要求不会那么高,只要能找到一个拟合度高的回归模型就ok啦。

14
刘坤元_leige 发表于 2016-5-16 15:41:43
星期天的早晨 发表于 2016-5-16 09:26
一个毕业答辩过来人的经验,实证就不说了,有一个问题楼主需要注意,既然是毕业论文,肯定要经过评委老师的 ...
文科专业(传播学)。我大学期间没学过spss。老师们也基本不懂(也有懂得老师)。很多老师是教视觉设计、视频剪辑、新闻写作、动画等方向。所以要求不会那么高,只要能找到一个拟合度高的回归模型就ok啦。

15
刘坤元_leige 发表于 2016-5-16 15:56:42
我之前建立回归模型:分析——回归——线性,然后方法好像是逐步进入法。得出了一个求因变量评论数的回归方程,带入excel表格中。发现有的能相差6000倍。好的结果,差距在百分之几十。有的真实评论数为0,可我算出来的结果是5到6000千。差距忒大。差距大的情况我也能接受。可是,与我预估的情况不一样。因为,我用excel分析:随着标题长度的增加,评论数先增加,然后再减少。而我建立的这个模型,是随着标题数增加,评论数一直增加的。(原因,标题长度与评论数不是线性关系,而是一条抛物线关系)。

让我画每个自变量与因变量的散点图。这我也能理解,而且在之前也做了。可是有的散点图让我傻眼了。不是我高中学的任何一个公式(非线性回归模型有11个,每个好像都不符合)。当然有的好像是符合的其中一些公式的。比如,来源网站这个自变量,画出的散点图特别奇怪。

在0,和1这两个x上面。各有一堆y值。也就是一个x(x是来源网站)对应了好多个y(y也即是评论数)值。为何要化为0和1,因为1代表这篇新闻是来自官方允许转载的网站新闻(比如这篇新闻转载自人民日报,那么就是1).如果转载自一些小报(官方没有公布能从这个小报转载新闻),那么结果就是0.  所以散点图让我看不懂了。

16
星期天的早晨 发表于 2016-5-16 18:49:25
刘坤元_leige 发表于 2016-5-16 15:41
文科专业(传播学)。我大学期间没学过spss。老师们也基本不懂(也有懂得老师)。很多老师是教视觉设计、 ...
是这样啊,我们在做数据分析之前,一定要对自己的数据进行一个初步的观察,根据你的部分数据,我有几个问题,第一:你这是时间序列数据还是截面数据或者面板数据?第二:表中有很多0、1的值,按照你的说法,那这部分数据指标实际上就是定性指标了,然后后面才是定量指标,如果你拿定性的指标和定量的指标观察散点图,这个不用想,得不出什么。第三:我们说在选择样本数据时,除了样本量要足够大,另一个问题就是对于某些异常值我们要剔除掉。另外,你的数据量纲不同,相差太大。即使做回归,那么回归拟合的结果肯定不好,那么就是说这个模型设定有问题,就不能用来做预测分析的模型。

17
刘坤元_leige 发表于 2016-5-16 19:47:12
星期天的早晨 发表于 2016-5-16 18:49
是这样啊,我们在做数据分析之前,一定要对自己的数据进行一个初步的观察,根据你的部分数据,我有几个问 ...
明白了。定性与定量的问题。看来我这个不能做回归分析了。我只做相关分析也可以了。剔除数据一般怎么剔除(剔除原则)。我去百度下剔除原则,虽然不做回归分析了,但剔除数据也对相关分析有用。

18
星期天的早晨 发表于 2016-5-16 20:00:01
刘坤元_leige 发表于 2016-5-16 19:47
明白了。定性与定量的问题。看来我这个不能做回归分析了。我只做相关分析也可以了。剔除数据一般怎么剔除 ...
这个是可以做的,就是说在解释变量中允许同时存在定性变量和定量变量,但散点图时看不出什么。我觉得可能是你数据的问题。

19
BIG钊钊 学生认证  发表于 2016-5-16 21:07:15 来自手机
从你的数据截图来看,你的评论数这个因变量可能存在异常值,过大或者过小,所以最后处理的时候可能需要掐头去尾一下。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-28 12:46