楼主: jijieweiliang
4862 8

[面板数据求助] 使用merge横向合并后,数据匹配混乱 [推广有奖]

  • 0关注
  • 0粉丝

初中生

28%

还不是VIP/贵宾

-

威望
0
论坛币
597 个
通用积分
0.0003
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
94 点
帖子
12
精华
0
在线时间
6 小时
注册时间
2014-4-20
最后登录
2017-4-28

楼主
jijieweiliang 发表于 2017-4-19 13:19:11 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求助大神!我在使用merge进行两个表的一对一合并时,检查合并后的数据,发现数据匹配混乱,是什么原因导致的呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge 数据匹配 是什么原因 求助大神 一对一

沙发
黃河泉 在职认证  发表于 2017-4-19 16:06:53
这样问应该是没人可以回答的!show 一部份原始资料与合并后之结果来看看(包括你执行之指令)!

藤椅
jijieweiliang 发表于 2017-4-19 16:27:51
恩恩,好的!
这是合并前的表1:
   S                 y                  roa            zcfzl             growth                   fss                       lnzzc
000002        2009         0.046727        0.670017        0.192458921        0.1473        25.64767893
000002        2010                0.040993        0.746861        0.037495914        0.1473        26.09686483
000002        2011         0.03916        0.770997        0.415446636        0.1473        26.41432923
000002        2012         0.041348        0.783163        0.436504506        0.1472        26.66027846
000002        2013                0.038183        0.77997        0.31326342        0.147        26.89539499
000002        2014                0.037937        0.772046        0.081002148        0.1491        26.9545516
000002        2015          0.04245        0.777015        0.335827547        0.1523        27.13884642
000002        2016         0.034129        0.805367        0.229753543        0.1524        27.44550351
000003        2001         0.009506        1.819934        -0.921229104        0.0748        20.91549013
000004        2001         0.05787        0.460723        -0.526860106        0.3794        19.2182276
000004        2002        0.031154        0.529541        0.955741878        0.3794        19.38999877
000004        2003        0.032123        0.46014        -0.013946384        0.3794        19.28725654
000004        2004        -0.015321        0.427696        -0.106974586        0.3794        19.18274862
000004        2005        -0.119186        0.358844        -0.42503029        0.3794        18.864525
000004        2006        0.014954        0.450415        -0.256411975        0.2844        19.13512276
000004        2007        -0.058897        0.424184        -0.113706621        0.2596        18.95026489
以下是合并前的表2:
S                  y             Nindcd               am                    rm
000001        2015         I01        0.001511451        0.108694255
000002        2002                J01        0.000335924        0.137313213
000002        2003          J01        -0.003105392        0.256767733
000002        2004         J01        -0.00172313        0.037977105
000002        2005         J01        0.000234577        0.152923116
000002        2006                J01        -0.006281396        0.526033547
000002        2007           J01        0.00294626        0.516344937
000002        2008        J01        -0.002294044        0.102030461
000002        2009        J01        0.001045075        0.043274796
000002        2010        J01        -0.000760919        0.281603046
000002        2011        J01        -0.001829392        0.34723304
000002        2012        J01        0.000275178        0.144835414
000002        2013        J01        0.000624486        0.202197431
000002        2014        J01        0.000123885        -0.003558721
000002        2015        J01        -0.000672665        0.130290415
000002        2016        J01        0.00044909        0.167046834
000004        2002        C81        -0.429394994        -0.781912947
000004        2003        C81        0.188709927        -0.78105012
000004        2004        C81        -0.206696263        -0.744056541
000004        2005        C81        -0.042770936        -0.900639601
000004        2006        C81        -0.461194471        -0.786521167

我是用的命令以及结果是这样的:

merge 1:1 S y using "D:\迅雷下载\新数据2017.4.14\控制变量4.18\2.dta"
(label S already defined)

    Result                           # of obs.
    -----------------------------------------
    not matched                        14,070
        from master                     6,181  (_merge==1)
        from using                      7,889  (_merge==2)

    matched                            14,203  (_merge==3)
    -----------------------------------------
合并之后的表一部分是这样的,这部分就是混乱的一部分:
S                   y          Nindcd        am                     rm              roa  zcfzl    growth   fss  lnzzc           _merge
000004        2002 C81        -0.429394994        -0.781912947                                                master only (1)
000004        2003        C81        0.188709927        -0.78105012                                                master only (1)
000004        2004        C81        -0.206696263        -0.744056541                                                master only (1)
000004        2005        C81        -0.042770936        -0.900639601                                                master only (1)
000004        2006        C81        -0.461194471        -0.786521167                                                master only (1)
000004        2007        C81        0.045355371        -0.661239773                                                master only (1)
做了很多次尝试,也找别的同学做了,但都是这样的结果,希望有大神可以帮忙解答!

板凳
黃河泉 在职认证  发表于 2017-4-19 17:44:08
jijieweiliang 发表于 2017-4-19 16:27
恩恩,好的!
这是合并前的表1:
   S                 y                  roa            zcfzl             growth          ...
你要用回复我会收到通知!此外,你的情况的确看起来有一点特殊,请用 dataex (先 ssc install dataex 并见说明) 将上述资料印出,我才能实验一下。否则,请将两个档寄给我 river@mail.tku.edu.tw,我来试试看!

报纸
蓝色 发表于 2017-4-19 18:16:18
你只需要把没有数据的s,y列单独保存,上传到网站就可以了
这样就知道为什么匹配不上了

地板
jijieweiliang 发表于 2017-4-19 18:21:15
黃河泉 发表于 2017-4-19 17:44
你要用回复我会收到通知!此外,你的情况的确看起来有一点特殊,请用 dataex (先 ssc install dataex 并见 ...
恩恩,好的,我已将两个表发给您了,麻烦您看看是什么情况吧,谢谢!

7
jijieweiliang 发表于 2017-4-20 09:19:07
蓝色 发表于 2017-4-19 18:16
你只需要把没有数据的s,y列单独保存,上传到网站就可以了
这样就知道为什么匹配不上了
谢谢,昨天的数据匹配混乱已找到问题所在,数据导入到state中时,S是字符型,我之前都把S变成数值型,然后再横向合并,昨天试了试不把S又字符型变成数值型,直接进行合并,就不会出现数据匹配混乱了,虽然不知道原因在哪。

8
jijieweiliang 发表于 2017-4-20 09:19:57
黃河泉 发表于 2017-4-19 17:44
你要用回复我会收到通知!此外,你的情况的确看起来有一点特殊,请用 dataex (先 ssc install dataex 并见 ...
你好,昨天的数据匹配混乱已找到问题所在:数据导入到state中时,S是字符型,我之前都把S变成数值型,然后再横向合并,昨天试了试不把S由字符型变成数值型,直接进行合并,就不会出现数据匹配混乱了,虽然不知道原因在哪。

9
枸东西 发表于 2024-5-17 16:29:28
jijieweiliang 发表于 2017-4-20 09:19
你好,昨天的数据匹配混乱已找到问题所在:数据导入到state中时,S是字符型,我之前都把S变成数值型,然后 ...
感谢,我也出现了类似问题,不知道原因究竟是什么!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 22:45