楼主: 资料狂人
24406 49

[李春涛] 中南财经政法大学金融学院金融系李春涛老师7月29日在线访谈 [推广有奖]

21
univ_farmer 发表于 2014-7-29 15:36:37
在实证研究中,我要求我的学生,全部的过程要机械化处理,就是不能有手工处理的任何痕迹,全部的处理过程要一个do文件做下来,原始数据永远保持原始的格式,不可以修改

22
ZahaH 发表于 2014-7-29 15:39:38
请教李老师,如何识别并删除工业企业数据库中的重复代码问题?谢谢您

23
univ_farmer 发表于 2014-7-29 15:39:39
一个人编程的能力,首先表现在字符串处理的能力上,然后是处理复杂数据的能力上,在处理复杂数据的时候,记着,你或许会需要用post命令,这简直就是一个法宝,战无不胜的法宝

24
znxkxx 发表于 2014-7-29 15:44:03
ZahaH 发表于 2014-7-29 15:17
感谢李春涛老师和徐鑫老师的解答,我还想再咨询一下:
第一,如何删除重复值,比如代码1在2005年在北京这个 ...
我觉得你说的第一个情况不能算是问题。因为理论上确实存在企业地址迁移的可能,并不能依据前后两年公司地址不同认为就是错误。对于剔除重复记录的问题,简单、直接的办法可以每年中对重复的公司样本进行剔除。
例如可以使用如下代码:
bysort firm_id: gen record_num = _N
drop if record_num>1

复杂一些、也更精确一些的方法是:除了依据法人代码,还应该依据其他信息如公司名称、公司主要产品、公司电话等综合判断是否为同一家企业。关于识别企业的问题、程序在前面回复中提到的两篇文中都有介绍,第二篇文章在网上公布了相应的代码。其他应该注意的问题也都在第一篇文献中有所提及,可以读来参考。

最后,工业企业调查数据数据量大,信息庞杂,而且由于不是统计部门发布的结果,难免有些缺陷,导致了数据处理上的一些麻烦,祝你早日得到理想的结果!

25
2013小贝 发表于 2014-7-29 15:50:24 来自手机
univ_farmer 发表于 2014-7-29 12:33
我很少使用绘图的功能,虽然知道这挺有用的。

对第一个问题,查了一下帮助,用legend()选项里面的orde ...
谢谢老师,提供一些思路,我在问老师一个问题,如果post和矩阵都可以完成的数据,在您看来,会选择哪个?

26
univ_farmer 发表于 2014-7-29 15:58:14
duplicates命令提供了一套完整的删除重复观测的方法

27
univ_farmer 发表于 2014-7-29 15:59:49
回复 小贝,如果你熟悉mata,建议使用矩阵,否则,建议使用post,而且post的用途更广,很多是矩阵难以解决的问题,况且post应用很直观

28
2013小贝 发表于 2014-7-29 16:04:33 来自手机
我也感觉post挺强大的,谢谢老师

29
2013小贝 发表于 2014-7-29 16:09:51 来自手机
老师回复的好快,老师您在用多个变量t检验的时候,结果怎样可以输出到外部文件呢?

30
univ_farmer 发表于 2014-7-29 16:10:19
今天的答疑到此结束,谢谢大家!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 06:39