收集的是08年到17年发生并购的公司数据,根据一篇论文的筛选操作(表述如下)
“为避免极端离群值的影响,本文连续型变量均采取 5% 的缩尾处理。此外,本文根据以下标准对总样本进行了剔除与筛选:选取交易地位为买方、重组类型为资产收购、标的类型为股权或资产的并购交易样本 ;剔除收购比例在 30% 以下的并购交易样本 ;剔除交易金额在 100 万以下的并购交易样本 ;剔除交易失败的样本 ;剔除 S T、ST* 类样本企业 ;剔除金融类样本企业 ;剔除管理者信息、主并双方财务数据等关键变量指标不完整的样本企业 ;剔除净资产为负数的样本企业 ;
合并同一企业在同一年份进行多次并购且并购标的相同的样本 ;对于同一企业在同一年份 进行多次并购且并购标的不同的样本,仅选取收购比例最高、交易金额最大的样本作为替代 ;为了剔除并购经验的影响,对于同一企业在样本选择期间内(2008-2015)进行多次并购的样本,仅选取第一次并购事件的样本作为替代 ;为了排除关联交易对并购溢价的影响,本文剔除了关联交易的样本。”
文章在实证分析部分说的是自己使用的是非平衡面板数据,但按照他的筛选步骤(主要是标红的文字),每年的公司应该都不一样,是不是应该是混合截面数据,还是我的理解有误,希望有擅长的人可以指点一下
我现在整理的数据也是08年到17年,每年的公司都不一样,如果按照面板数据在stata中处理,xtset id year 显示weakly balanced 在做豪斯曼检验的时候出现insufficient observations的提示。
有没有人遇到过类似的问题,求指教,折腾好久了,还是没能解决[cry]