楼主: xiaochong1a
3842 6

[面板数据求助] 数据横向合并问题,求解答 [推广有奖]

  • 3关注
  • 0粉丝

已卖:176份资源

讲师

96%

还不是VIP/贵宾

-

威望
0
论坛币
4957 个
通用积分
5.0701
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
12756 点
帖子
178
精华
0
在线时间
738 小时
注册时间
2016-12-2
最后登录
2025-7-28

楼主
xiaochong1a 学生认证  发表于 2017-3-25 16:38:54 |AI写论文
10论坛币
在进行数据的横向合并的时候,使用merge 1:1 地区 using 平均受教育水平
出现以下结果:
. merge 1:1 地区 using 平均受教育水平
(note: variable 地区 was str9, now str10 to accommodate using data's
       values)

    Result                           # of obs.
    -----------------------------------------
    not matched                            64
        from master                        32  (_merge==1)
        from using                         32  (_merge==2)

    matched                                 0  (_merge==3)
    -----------------------------------------
请问,这是什么原因,该怎么处理?求大神解答

关键词:求解答 Variable Matched Master values

沙发
黃河泉 在职认证  发表于 2017-3-25 18:02:30
请用 dataex (ssc install dataex) 将两个 Stata 资料列出前五笔以供练习!
  1. dataex in 1/5
复制代码

藤椅
xiaochong1a 学生认证  发表于 2017-3-25 20:34:14
黃河泉 发表于 2017-3-25 18:02
请用 dataex (ssc install dataex) 将两个 Stata 资料列出前五笔以供练习!
不是这个问题。已经解决了。还是谢谢您

板凳
xiaochong1a 学生认证  发表于 2017-3-28 09:10:20
是excel数据格式的问题

报纸
4095413437311 学生认证  发表于 2023-4-21 14:00:31
xiaochong1a 发表于 2017-3-28 09:10
是excel数据格式的问题
请问楼主如何解决的?

地板
4095413437311 学生认证  发表于 2023-4-21 16:51:05
xiaochong1a 发表于 2017-3-28 09:10
是excel数据格式的问题
请问楼主是如何解决的?

7
赵安豆 发表于 2024-9-22 20:14:45
这个问题通常发生在当你尝试使用`地区`这个变量来匹配两个数据集时,但在这两个数据集中,`地区`的值并没有完全对齐。从错误信息中可以看出:

1. 数据合并后有64个观测没有被匹配上(32个来自主数据集,另外32个来自需要合并的数据集)。
2. 没有任何观测是成功匹配的。

这可能是因为两个原因导致:
- `地区`变量在两个数据集中编码或写法不一致。例如,在一个数据集中“北京”被标记为“Beijing”,而在另一个数据集中它被标记为“北京市”。这样即使是指同一个地区,Stata也不会认为它们是相同的值。
- 可能有一方或者双方的`地区`变量中存在缺失值。

处理方法如下:
1. 检查和标准化`地区`这个变量:确保两个数据集中的`地区`编码完全一致。你可以在合并之前先使用`destring`或`encode`命令将字符串转换为数字,或者使用`replace`来统一地区名称的写法。
2. 处理缺失值:如果存在缺失值,在合并前需要处理好这些缺失值,例如用一个特定代码(如999)代替或者删除包含缺失值的观测。

例如,你可以这样尝试:
```
use 主数据集, clear
destring 地区 if 地区 != "", replace

use 平均受教育水平, clear
destring 地区 if 地区 != "", replace

merge 1:1 地区 using 平均受教育水平
tab _merge
```

如果问题依旧,你可能需要仔细检查地区名称的具体值,并进行必要的替换或匹配。例如,如果发现"北京"和"Beijing"在不同的数据集中,你可以使用`replace 地区 = "北京市" if 地区 == "Beijing"`这样的命令来标准化名称。

希望这能帮到你解决问题!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-24 12:19