楼主: 资料狂人
19648 48

[李春涛] 中南财经政法大学金融学院金融系李春涛老师7月29日在线访谈 [推广有奖]

21
univ_farmer 发表于 2014-7-29 15:36:37 |只看作者 |坛友微信交流群
在实证研究中,我要求我的学生,全部的过程要机械化处理,就是不能有手工处理的任何痕迹,全部的处理过程要一个do文件做下来,原始数据永远保持原始的格式,不可以修改

使用道具

22
ZahaH 发表于 2014-7-29 15:39:38 |只看作者 |坛友微信交流群
请教李老师,如何识别并删除工业企业数据库中的重复代码问题?谢谢您

使用道具

23
univ_farmer 发表于 2014-7-29 15:39:39 |只看作者 |坛友微信交流群
一个人编程的能力,首先表现在字符串处理的能力上,然后是处理复杂数据的能力上,在处理复杂数据的时候,记着,你或许会需要用post命令,这简直就是一个法宝,战无不胜的法宝

使用道具

24
znxkxx 发表于 2014-7-29 15:44:03 |只看作者 |坛友微信交流群
ZahaH 发表于 2014-7-29 15:17
感谢李春涛老师和徐鑫老师的解答,我还想再咨询一下:
第一,如何删除重复值,比如代码1在2005年在北京这个 ...
我觉得你说的第一个情况不能算是问题。因为理论上确实存在企业地址迁移的可能,并不能依据前后两年公司地址不同认为就是错误。对于剔除重复记录的问题,简单、直接的办法可以每年中对重复的公司样本进行剔除。
例如可以使用如下代码:
bysort firm_id: gen record_num = _N
drop if record_num>1

复杂一些、也更精确一些的方法是:除了依据法人代码,还应该依据其他信息如公司名称、公司主要产品、公司电话等综合判断是否为同一家企业。关于识别企业的问题、程序在前面回复中提到的两篇文中都有介绍,第二篇文章在网上公布了相应的代码。其他应该注意的问题也都在第一篇文献中有所提及,可以读来参考。

最后,工业企业调查数据数据量大,信息庞杂,而且由于不是统计部门发布的结果,难免有些缺陷,导致了数据处理上的一些麻烦,祝你早日得到理想的结果!

使用道具

25
2013小贝 发表于 2014-7-29 15:50:24 来自手机 |只看作者 |坛友微信交流群
univ_farmer 发表于 2014-7-29 12:33
我很少使用绘图的功能,虽然知道这挺有用的。

对第一个问题,查了一下帮助,用legend()选项里面的orde ...
谢谢老师,提供一些思路,我在问老师一个问题,如果post和矩阵都可以完成的数据,在您看来,会选择哪个?

使用道具

26
univ_farmer 发表于 2014-7-29 15:58:14 |只看作者 |坛友微信交流群
duplicates命令提供了一套完整的删除重复观测的方法

使用道具

27
univ_farmer 发表于 2014-7-29 15:59:49 |只看作者 |坛友微信交流群
回复 小贝,如果你熟悉mata,建议使用矩阵,否则,建议使用post,而且post的用途更广,很多是矩阵难以解决的问题,况且post应用很直观

使用道具

28
2013小贝 发表于 2014-7-29 16:04:33 来自手机 |只看作者 |坛友微信交流群
我也感觉post挺强大的,谢谢老师

使用道具

29
2013小贝 发表于 2014-7-29 16:09:51 来自手机 |只看作者 |坛友微信交流群
老师回复的好快,老师您在用多个变量t检验的时候,结果怎样可以输出到外部文件呢?

使用道具

30
univ_farmer 发表于 2014-7-29 16:10:19 |只看作者 |坛友微信交流群
今天的答疑到此结束,谢谢大家!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 21:42