17110 19

[数据管理求助] 求助!stata根据字符型变量,用merge合并数据一直出错 [推广有奖]

  • 2关注
  • 0粉丝

本科生

26%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1535 点
帖子
47
精华
0
在线时间
123 小时
注册时间
2016-4-22
最后登录
2019-6-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
合并用的是字符型变量(country),结果一直出错。字符型country已经转为数值型。表一是主要数据:
countryyearvar1var2
英国 2016 1 5
英国 2017 2 6
香港 2015 3 7
澳门 2015 4 8

现在想要将英文名加入表一,但是表二包括了不属于表一的国家英文名,且表一国家因为年份不一样有多个。
表二:
country country1
英国 Britain
香港 Hongkong
澳门 Macao
印度 India
荷兰 Netherlands

想合并成表三:
country country1 year var1var2
  英国  Britain2016 1 5
  英国  Britain2017 2 6
香港 Hongkong 2015 3 7
澳门 Macao 2015 4 8

使用merge m:m using 合并结果不一致,后用merge m:1 using也达不到效果。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge 字符型变量 Stata 合并数据 tata stata merge

回帖推荐

蓝色 发表于10楼  查看完整内容

蓝色的根本不是字符型变量是数字型, 蓝色的是表面现象,掩盖了下面的真实数值 合并的时候是按照数值合并的 你要 label drop _all 才能看到真实的数值 不用用encode 处理 统一的字符,产生的数值是不同的
沙发
qiangli 发表于 2018-3-24 12:56:05 来自手机 |只看作者 |坛友微信交流群
m:1是对的

使用道具

藤椅
黃河泉 在职认证  发表于 2018-3-24 16:04:48 |只看作者 |坛友微信交流群
1.        你若要问程序 (code),请附上资料;你若要附上资料,请用 dataex 印出资料。
2.        尔后建议请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

使用道具

黃河泉 发表于 2018-3-24 16:04
1.        你若要问程序 (code),请附上资料;你若要附上资料,请用 dataex 印出资料。
2.        尔后建议请用 dataex ( ...
感谢黄老师指出!

使用道具

qiangli 发表于 2018-3-24 12:56
m:1是对的
结果还是对应不上,英国会和印度的英文对应在一块了。我想是不是因为表一有重复值的缘故所导致的,现在还在检查哪里出问题。

使用道具

地板
蓝色 发表于 2018-3-24 22:05:04 |只看作者 |坛友微信交流群
就是m:1
不会匹配错误
英文一样的才能匹配一起

使用道具

蓝色 发表于 2018-3-24 22:05
就是m:1
不会匹配错误
英文一样的才能匹配一起
我用的关键变量是中文字符(国家名,但是用encode语句转成了数值型),这样子合并对不上,估计是不支持中文做关键变量吧,最近也是第一次出现这个情况...

使用道具

8
蓝色 发表于 2018-3-27 20:29:04 |只看作者 |坛友微信交流群
没有问题
中文也可以匹配上

使用道具

蓝色 发表于 2018-3-27 20:29
没有问题
中文也可以匹配上
图一是英文名数据: 1.png


图二是数据: 数据.png


合并结果: 英文名.png



之前英文名的表我并未加入时间,这几天我也整理好时间加入,结果还是错的.

合并结果.png (56.95 KB)

合并结果.png

使用道具

10
蓝色 发表于 2018-3-27 21:29:16 |只看作者 |坛友微信交流群
蓝色的根本不是字符型变量是数字型,
蓝色的是表面现象,掩盖了下面的真实数值
合并的时候是按照数值合并的


你要
label drop  _all
才能看到真实的数值
不用用encode
处理
统一的字符,产生的数值是不同的

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-12 03:21