【解答】
按照提问人的要求,此处只回答如何做跨层分析,而不讨论是否应该用跨层分析。根据提问人的描述,我猜测数据结构是企业层面的面板数据,donation,size,leverage等变量是企业层面的变量,且取值可随时间变化,分别表示慈善捐赠、企业规模、企业杠杆率(后两个变量的含义是我的猜测)等;poor,market等变量是城市层面的变量(我不理解提问人为何说城市层面的变量只有market,请提问人确认),且取值可随时间变化,分别表示市委书记的贫困经历、城市市场化程度等含义。假设一个企业始终坐落于一个固定的城市,不会搬迁(提问人没有说明数据结构,所以姑且这样认为),那么企业就是嵌在城市里的;用分层的语言说,就是企业是较低层的主体,城市是较高层的主体。
分层线性模型(HLM)是一个庞大的体系,需要提问人系统学习教科书(有许多教科书整本都在讲分层模型)等相关资料,本回答不可能帮助提问人精通此方法,但可以通过一个例子使提问人对相关做法有基本概念。例子如下:首先,进行分层。第一层就是初始的企业-时间层面,第二层就是企业层面,第三层就是城市层面,低层均嵌在高层里面。其次,思考第二、三层模型的截距和斜率的结构,也即是否是随机截距或/和随机斜率——这涉及到模型筛选,可以通过运行不同模型,然后利用似然比检验判断模型好坏。假如我们最终选定的模型是第二、三层都有随机截距(也即截距的水平随不同层组会发生变化),且 size 和 leverage 等变量的系数有随机斜率结构,且随机的层次是城市层面(这些变量对 donation 的影响在不同城市中是不一样的),那么Stata命令可以写成如下形式:
mixed donation size leverage poor market || cityid: size leverage || firmid:
其中,cityid 和 firmid 分别表示城市和企业的识别变量。运行后,Stata会汇报各变量的确定性的系数估计、城市和企业层面随机截距的方差、size 和 leverage 在城市层面随机斜率的方差等信息。如果假设城市层面随机截距和随机斜率不相互独立,可在城市层面加入cov(un)选项计算它们的协方差。
最后需要强调的是,上面只是一个例子,提问人需要比较不同模型,通过似然比检验等工具筛选出最优模型进行分析