楼主: 数据寿司
1517 5

[统计软件] python抓了50W数据 跑了结果,大牛帮忙来解答一下 谢谢 [推广有奖]

  • 1关注
  • 4粉丝

讲师

36%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
9.4767
学术水平
11 点
热心指数
11 点
信用等级
10 点
经验
2180 点
帖子
123
精华
0
在线时间
843 小时
注册时间
2017-10-24
最后登录
2024-4-27

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1、用python抓了电商的数据,大概100W条记录,删除了50W
2、想靠这个数据进行实证研究,本人原来计算机方向
3、自己看了书编写了 python 的OLS代码,输出了回归结果,主要看y和其他几个x1 x2 x3 x4 x5 x6等的想关系
4、如果有两个假设模型,就需要做2个OLS回归吗?例如 y和x1 x2 x3 是一个模型假设判断    y和x4 x5 x6 是一个假设判断
5、我的数据基本都不线性的,例如会员等级

但是我不是统计出身,对这么对数据的解读不是很精通,还请帮忙
如果想利用数据搞研究的,我们可以合作,我的数据绝对比那些cssci的数据要真是可靠,数据量大,我看ssci和cssci做这个研究的数据量3W就了不起了,但是这电商领域需要大样本才能看出一些问题

上结果
微信截图_20180126095250.png
还请大神给分析一下,我的Jjar bera 值怎么那么大
这个结果怎么样,能解释说明模型的可靠性么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python CSSCI SSCI CSSC 回归结果

已有 1 人评分经验 学术水平 热心指数 收起 理由
yangyuzhou + 100 + 1 + 1 鼓励积极发帖讨论

总评分: 经验 + 100  学术水平 + 1  热心指数 + 1   查看全部评分

沙发
hustlc319 发表于 2018-1-31 15:58:54 |只看作者 |坛友微信交流群
第一,不清楚你的各个变量是什么,也就不清楚你的变量基本假设是什么,那么系数符号是否有意义,模型是否合理不得而知;
第二,你问JB检验问题,我个人觉得与你的样本数量过大有关,但是下面的P值很清楚的告诉你,拒绝了正太分布假设;
第三,模型是否合理不是看数据结果就行的,个人不是大神,意见仅供参考

使用道具

藤椅
数据寿司 在职认证  发表于 2018-2-1 11:44:25 |只看作者 |坛友微信交流群
hustlc319 发表于 2018-1-31 15:58
第一,不清楚你的各个变量是什么,也就不清楚你的变量基本假设是什么,那么系数符号是否有意义,模型是否合 ...
谢谢哈,我的模型很简单就是看x1---x12和目标变量y的相关性也就是评论的特征(很多维度x1---x12),和评论的有用性(y,评论被点赞)的关系

使用道具

板凳
hustlc319 发表于 2018-2-1 12:15:58 |只看作者 |坛友微信交流群
数据寿司 发表于 2018-2-1 11:44
谢谢哈,我的模型很简单就是看x1---x12和目标变量y的相关性也就是评论的特征(很多维度x1---x12),和评论 ...
建议你将解释变量进一步处理,得到可能最能影响Y的几个重要变量,从而重新回归,可能效果更好,而且一般人更想知道什么那几个因素是主要的,怎么影响的。鉴于你这哥可能是截面数据,可能需要考虑异方差、内生性等问题。仅供参考,祝好运!

使用道具

报纸
数据寿司 在职认证  发表于 2018-2-5 13:56:21 |只看作者 |坛友微信交流群
hustlc319 发表于 2018-2-1 12:15
建议你将解释变量进一步处理,得到可能最能影响Y的几个重要变量,从而重新回归,可能效果更好,而且一般人 ...
谢谢,我先去学习一下,然后看看怎么再处理一下数据

使用道具

地板
阿扁V5 学生认证  发表于 2018-2-24 11:10:28 |只看作者 |坛友微信交流群
如果是线性回归,R方那么低,基本上模型没有什么解释性,JB统计量是检验正态分布的,显然是拒绝了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 05:46