楼主: li-aolin
7078 8

[数据管理求助] merge合并后删除不匹配变量 [推广有奖]

  • 1关注
  • 0粉丝

高中生

35%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.1620
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
130 点
帖子
14
精华
0
在线时间
37 小时
注册时间
2022-7-21
最后登录
2024-3-11

楼主
li-aolin 发表于 2022-7-30 23:07:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求问各位大神,比如我以A数据为基础,合并B数据。合并完之后会出现merge==1、2、3的三种情况,merge==1是A有B没有,merge==2是A没有B有。对于这种情况,我在数据处理的过程中应该把merge==1和2的都给删除掉吗?第一次处理数据实在不知道怎么办是对的,还请各位帮帮忙。(这里A是总资产基础数据、B是自变量数据,后续还会合并因变量和控制变量的,对于这些应该怎么保留与删除也求各位指点)谢谢!!!

merge==2情况
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge 不匹配 请各位帮帮忙 基础数据 控制变量 数据处理 stata;数据处理 merge横向合并 stata数据分析merge使用方法

微信图片_20220730225750.jpg (145.34 KB)

merge==1情况

merge==1情况

沙发
917968079 发表于 2022-7-31 09:27:31 来自手机
li-aolin 发表于 2022-7-30 23:07
求问各位大神,比如我以A数据为基础,合并B数据。合并完之后会出现merge==1、2、3的三种情况,merge==1是A有 ...
我一般是保留1和3

藤椅
li-aolin 发表于 2022-7-31 09:36:54
917968079 发表于 2022-7-31 09:27
我一般是保留1和3
1的话那些没有的用缺失值处理吗

板凳
917968079 发表于 2022-7-31 09:48:18
li-aolin 发表于 2022-7-31 09:36
1的话那些没有的用缺失值处理吗
等匹配完再处理也不迟,留着也没啥坏处,我一般不会删主数据的内容

报纸
毛毛熊27h 发表于 2022-8-1 15:24:30
同意楼上的说法,如果不是缺失很多的哈,通常保留1与3。而且后期研究可能还会匹配一些新的数据进去,如果无限的剔除主数据内容,那么研究的结论是不稳定的。主数据中如果存在缺失值,按照情况选择不同的方法填补就行了。

地板
Lee_iris 在职认证  学生认证  发表于 2022-8-1 18:33:30
首先,需要看一下,没匹配上的数据是为什么没匹配上,是不是同一个匹配变量的值在两个数据里的格式或者其他写法不同,这种在统一后也是可以匹配上的,能够减少数据损失。比如通过地名匹配两个数据,在其中一个数据集里,有北京,而另一个是北京市,这种直接匹配不上,但在更正某一个数据以后就可以匹配上。
其次,要明确,using的这个文件的变量是不是核心变量,缺了就不行,如果是的话,这时候删不删对后面回归结果影响不大,也是可以删去的。

7
白眉老夫子 在职认证  发表于 2022-8-2 08:50:17
看情况,有的时候保留1,有的时候保留1和3,关键是要看你匹配需求,你可以看一下1和3分别代表什么含义,之后你就清楚为什么要保留1或者1和3了

8
A猫 发表于 2022-8-4 16:09:01
一般保留完整的基础数据(1和3),因为你还要用它匹配别的变量

9
翱翔FLY 发表于 2022-8-7 18:19:50
keep(matched)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-2 17:22