|
因此,我们致力于确定引发股价重大调整的主题。为此,我们首先展示了8-K字母的基本语料库,然后是描述性见解。然后,我们使用潜在Dirichlet分配根据受试者自动对8-K婴儿进行分类,并按主题研究对股票价格的平均影响。4.1语料库为了创建我们的8-K文件语料库,我们进行了以下工作:从2004年至2013年,我们从EDGAR网站下载了所有8-K文件,包括标题和修改文件。这就得到了总共901133根纤维,然后经过了几个过滤步骤。首先,我们只从在纽约证券交易所(NYSE)上市的公司中选择公司。其次,为了获得信息,将SEC CIK编号与纽约证券交易所的股票符号进行匹配。第三,我们不包括美国证券交易委员会:http://www.sec.gov.that包含少于个单词(Loughran和McDonald,2011)。与之前的文献一致,我们还剔除了股价低于500美元异常回报率的低价股(Konchitchki和O\'Leary,2011)。这些过滤步骤最终产生了73986个语料库。4.2描述性统计我们现在调查以下事件的频率和长度。我们的语料库涵盖了所有不同的公司,而公司的中位数为85.73(标准差为66.73)。单个企业的总范围从最小1到最大501。表1显示了8-K filings语料库在交易日结束时的异常回报的描述性统计。样本中所有8-K公司的异常回报率平均变化为0.0361%。在所有披露的信息中,共有36587份导致37378份股票市场回报(以%计),标准差为4.03,中位数接近当年。
|