毕业论文选题是豆瓣电影中在线评论有用性的影响因素,从豆瓣电影中爬下了八部电影的影评数据
所有数据放在一起得出了一个结果,但是发现其中一个变量的结果与假设相反,并且有点违背常理,所以又对每一部电影的评论数据再做一次回归分析,然而每一部的结果都不尽相同,其他几个变量的相关性和显著检验也有一些变化,请问这种情况怎么处理?
与假设相反的那个变量是积极反馈数,就是评论被点赞或者推荐的次数,回归的结果是与评论有用性呈负相关且显著,我觉得问题可能在于每部电影热度不一样,所以评论获得点赞或推荐的绝对数量也不一样,把8部电影数据放在一起后导致了很大偏差,请问这种情况下能否先剔除这个变量,之后再单独每部电影对这个变量进行分析