各位大佬,我是学英语语言学的,毕业论文要用一个叫 贝叶斯混合效应负二项式回归的模型。以下简要说说我的数据和需求
数据:我现在有1710个文本作为观测,每个文本有一个总词数,然后有一个我想考察的目标词的数量,这1710个文本分布于1600-1999(以50年为界)7个时间段内,分布于两个变体(英式英语和美式英语,2个水平)且分布于12个体裁/文体中(12个水平)。
需求:要通过建模,发现随时间变动,我的目标词有一个向上的趋势。
疑惑:1)因为我确实没学过数学、统计学之类的东西,翻了一些材料。大致是负二项式是一个计数模型,这个模型是应该包括每个文本的总词数和目标词的数量吗?
2)参考了一篇论文是说,将体裁看做是随机效应,这是不是就是所说的那个 multilevel model?
3) 贝叶斯是用先验推断后验,具体应该如何用stan和R写出代码呢?
还望各位大佬救救孩子,不吝赐教!能帮我解答一点也可以呀,或者说有没有别的比较简单一点的建模方法?谢谢大家!!!


雷达卡


京公网安备 11010802022788号







