楼主: peyzf
1922 4

[Stata高级班] 企业数据库的id-年份匹配 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2012-12-19 02:39:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

老师好,

     练习企业数据的年度匹配,匹配变量有企业代码与企业名,有a,b,c三年数据。但企业名与代码可能出现误填,因此不能进行精确匹配。如何构建企业面板数据?

有些文献建议采用双向匹配,即对企业代码及企业名分别匹配,以增加匹配成功的概率。

有经验的人们,请提供一些建议?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:企业数据 数据库 面板数据 企业 如何

本帖被以下文库推荐

沙发
arlionn 在职认证  发表于 2012-12-19 16:01:56
只能先从源头入手,想办法把企业的名称规整一下,然后再进行后续的合并了。

藤椅
peyzf 发表于 2012-12-19 17:21:25
谢谢。

板凳
peyzf 发表于 2012-12-20 07:44:53
聂等(2012)等指出,在匹配企业时,可以采用如下方法:

如何实现?


我们建议的做法是: 将企业按企业代码和企业名称分别进行两次分组,然后考察
同一名称组下的企业是否分属不同的代码组。若是,则将这些不同代码组内的所有企
业都归为一组( 对每一名称组都依此进行操作,不断重新归组,可以称之为“交叉匹
配”) ; 若新组内没有年份重复的观测值,则将这一组样本点识别为同一家企业; 若新
组内存在年份重复的观测值,则进入下一步人工识别。在人工识别阶段可能存在多种
情况,需要根据数据特征和基本信息进行综合判断。例如,同一组内的样本点可能属
于同一家企业,只是其中某些年份有两个观测值,这两个观测值只需要保留一个,另一
个完全重复或关键变量均缺失。同一组内的样本点也可能属于不同企业,但其中可能
存在企业代码登记错误的情况,此时需要参照企业名称、法人代表姓名、地址、行业代
码、销售额或注册资本等关键变量的数量级等信息进行分类,确定哪些样本属于同一
家企业。我们发现,使用交叉匹配方法后,大约有10% 的观测值( 大约20 万个) 属于
名称相同但法人代码不同或者相反的情况。显然,如果忽视匹配问题会严重地影响样
本的真实性和准确性。

报纸
arlionn 在职认证  发表于 2012-12-20 09:09:37
这个建议不错。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 23:14