在Stata中,你可以使用`collapse`命令来汇总数据。如果你的数据集中包含“省份”(例如变量名是`province`),“年份”(例如变量名是`year`),以及每个企业的标识符(例如变量名是`firm_id`或直接用观测值计数),你可以按照以下方式操作:
假设你的企业标识符就是数据集中的每一条观察,那么你不需要特定的变量来表示企业数量。我们可以简单地对每年、每个省份的观察值进行计数。
下面是一个具体的示例命令:
```stata
collapse (sum) total_firms=1, by(year province)
```
但是,在Stata中直接用`total_firms=1`这种方式可能不会被接受,因为`collapse`通常需要数值变量。如果数据集中的每个观察确实代表一家企业,并且你仅仅是想计数,那么首先你需要生成一个全部为1的变量:
```stata
gen firm_indicator = 1
```
然后使用以下命令汇总:
```stata
collapse (sum) firm_indicator, by(year province)
rename firm_indicator total_firms
```
这样`total_firms`就会包含每个省份在不同年份的企业新增数量。
如果数据集中的企业成立时间是明确记录的,比如有一个“成立年份”变量(例如叫做`establishment_year`),你还可以基于这个变量来过滤和汇总每年的新成立企业数。在这种情况下,你需要先确定要分析的时间范围,然后在执行`collapse`命令之前使用`if`条件语句选择相关的观察值。
```stata
keep if establishment_year >= your_start_year & establishment_year <= your_end_year
gen firm_indicator = 1
collapse (sum) firm_indicator, by(establishment_year province)
rename firm_indicator total_firms
```
记得将`your_start_year`和`your_end_year`替换为你要分析的起始年份和结束年份。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用