楼主: 笨笨小夕
15570 10

[编程问题求助] 数据匹配问题:公司名称和年份两个条件匹配的stata实现 [推广有奖]

  • 3关注
  • 0粉丝

博士生

58%

还不是VIP/贵宾

-

威望
0
论坛币
142 个
通用积分
50.0030
学术水平
0 点
热心指数
3 点
信用等级
0 点
经验
4998 点
帖子
83
精华
0
在线时间
547 小时
注册时间
2016-8-25
最后登录
2024-4-29

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
您好,我在整理数据的过程中遇到了如下的问题,希望能得到您的帮助:
数据库A和数据库B均包含了公司名称和年份(公司并不完全重合),但因为两个数据库中分别有一些关键的变量,因此需要对其进行匹配。不知道要从何处入手比较好。

数据库A:工业企业数据库

数据库B:工业企业签订某项合同条款的数据

在条款中明确列出

签订合同方:北京科技集团有限公司——诸如此类的公司名称

合同签订年份:2010年

其他和合同相关的具体款项


目的是希望将工企数据库中的企业和签订合同的相关企业进行整理。(因为数据库B也是老师辛苦整理,不确定是否可以提供准确信息和数据)

如果我的问题仍没阐述清楚,也请您告诉我!

初入门,举步维艰!!如果能得到您的帮助,不甚感激!!



再次感谢已经提出建议的各位!!方法我都会试一试的!!
谢谢您对这个问题的关注!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数据匹配 tata 公司名 整理数据

沙发
whbscut 学生认证  发表于 2017-10-31 22:02:02 |只看作者 |坛友微信交流群
用python的pandas库可以处理,stata的处理还得高手才会。

使用道具

藤椅
deem 学生认证  发表于 2017-10-31 22:27:02 |只看作者 |坛友微信交流群
  1. help merge
  2. help joinby
复制代码

使用道具

板凳
笨笨小夕 发表于 2017-10-31 22:36:43 |只看作者 |坛友微信交流群
deem 发表于 2017-10-31 22:27
谢谢您的关注!!
因为是直接以名称作为变量,所以help也束手无策···

仍然谢谢您!🙏

使用道具

报纸
deem 学生认证  发表于 2017-11-1 00:45:08 |只看作者 |坛友微信交流群
笨笨小夕 发表于 2017-10-31 22:36
谢谢您的关注!!
因为是直接以名称作为变量,所以help也束手无策···
商业数据库一般有可以match的key,否则你只能将两个表中unique公司名字取出来,再手工做一张辅助链接的表

使用道具

地板
黃河泉 在职认证  发表于 2017-11-1 07:18:59 |只看作者 |坛友微信交流群
1. 这样的问法很难得到有效的帮助!请举个例子!2. 建議用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 https://bbs.pinggu.org/thread-5048204-1-1.htmlhttps://bbs.pinggu.org/thread-5917273-1-1.html

使用道具

7
笨笨小夕 发表于 2017-11-1 15:21:18 |只看作者 |坛友微信交流群
黃河泉 发表于 2017-11-1 07:18
1. 这样的问法很难得到有效的帮助!请举个例子!2. 建議用 dataex (先 ssc install dataex 并见说明) 将原始 ...
非常感谢您的批评指正!
在论坛上提问不多,也未仔细浏览过版规!!是我疏忽了!!
谢谢您!!

使用道具

8
笨笨小夕 发表于 2017-11-17 15:56:43 |只看作者 |坛友微信交流群
自己来这里补充,目前已经解决啦!如果您也有同样的问题,希望可以帮助到您。
方法不是非常的简单,主要使用的是Excel表格
将工业企业数据库按年份分割,将企业名称提取到Excel中,直接提取全表容易出现莫名其妙的空格。
将合同数据库同样按照年份分割,提取企业名称,并添加值,记为1
使用VLOOKUP函数,1即是工企数据库中签订合同的公司啦,使用=if(iserror(var)=true,0,1),可以将不能匹配成功的,显示为#NA的表示为0,得到Excel表1。
在将分割的表格和工企数据库match,以及append,就可以实现啦!

中间尝试过用R,实现的数据只有200多个,使用Excel匹配出为1的数据是40000多个,差距较大。不会用Python,拜托了一位小伙伴,似乎也不能实现。

刚入门,觉得能解决的都是方法,再次感谢关注的各位!!

使用道具

9
老老根儿 发表于 2018-12-3 15:01:24 |只看作者 |坛友微信交流群
笨笨小夕 发表于 2017-11-17 15:56
自己来这里补充,目前已经解决啦!如果您也有同样的问题,希望可以帮助到您。
方法不是非常的简单, ...
请问您可以具体说一下怎么match和append么?初学stata,好难,求解答,跪谢!!

使用道具

楼主,可以指教工企数据库和其他数据库匹配的问题吗?付费也没问题哈,跪谢~~~~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 09:25