楼主: wonway
16513 4

[其他] stata能否模糊匹配样本 [推广有奖]

  • 0关注
  • 4粉丝

硕士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
801 个
通用积分
54.0353
学术水平
1 点
热心指数
2 点
信用等级
1 点
经验
2181 点
帖子
129
精华
0
在线时间
121 小时
注册时间
2008-4-13
最后登录
2022-5-2

楼主
wonway 发表于 2011-5-13 15:36:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教:
两组美国数据,在代码不能完全匹配的情况下,想通过公司名称来匹配,如果两个公司有相同的单词就认为他们是同一个公司,比如 Big Apple Com.和 Apple ins.就认为是匹配上的,这个用stata怎么实现呢?
谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata Apple appl 美国数据 美国数据 Apple 样本 单词

已有 1 人评分经验 收起 理由
remlus + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

沙发
sungmoo 发表于 2011-5-13 17:42:26
wonway 发表于 2011-5-13 15:36 两组美国数据,在代码不能完全匹配的情况下,想通过公司名称来匹配,如果两个公司有相同的单词就认为他们是同一个公司,比如 Big Apple Com.和 Apple ins.就认为是匹配上的,这个用stata怎么实现呢?
这里先要面对一个逻辑问题:

"Big Apple inc"、"Apple com"、"Orange com"算不算同一个公司?(传递性问题)

藤椅
wonway 发表于 2011-5-16 23:37:12
sungmoo 发表于 2011-5-13 17:42
wonway 发表于 2011-5-13 15:36 两组美国数据,在代码不能完全匹配的情况下,想通过公司名称来匹配,如果两个公司有相同的单词就认为他们是同一个公司,比如 Big Apple Com.和 Apple ins.就认为是匹配上的,这个用stata怎么实现呢?
这里先要面对一个逻辑问题:

"Big Apple inc"、"Apple com"、"Orange com"算不算同一个公司?(传递性问题)
假如现在有两组一一对应的变量,name1 和name2,然后如果两组有相同单词,则认为他们是同一个公司,生成一个新的变量==1 否则为0。
name1                name2
Big Apple inc     Apple com
Small inc           small inc
Orange com      Orange

这样的话就不存在传递性的问题了应该?请问这样可以用stata实现吗?谢谢!!

板凳
sungmoo 发表于 2011-5-17 06:54:27
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
日新少年 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

报纸
日新少年 学生认证  发表于 2019-6-16 00:23:20
sungmoo 发表于 2011-5-17 06:54
https://bbs.pinggu.org/thread-893472-1-1.html
谢谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-5 18:28