楼主: weishoudao
14905 8

[数据管理求助] 多个dta数据合并 [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

博士生

55%

还不是VIP/贵宾

-

威望
0
论坛币
179 个
通用积分
6.2000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
48289 点
帖子
121
精华
0
在线时间
497 小时
注册时间
2005-10-7
最后登录
2026-1-21

楼主
weishoudao 发表于 2017-4-24 21:07:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1.jpg
如上图,将0.dta和15.dta均放在F:\3下,两个文件里面均含有reportername productcode partnername year这些变量,我想将两个文件按这些变量合并成一个文件,但是出现上图的结果。请问如何才能合并完成?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据合并 dta reporter partner Product

沙发
SiGre 发表于 2017-4-30 11:48:58
你只能有一个唯一的识别变量 ,以他合并两个数据

藤椅
黃河泉 在职认证  发表于 2017-4-30 16:41:06
SiGre 发表于 2017-4-30 11:48
你只能有一个唯一的识别变量 ,以他合并两个数据
Not exactly! 有时我们需要两个或以上之变量来合并数据!

板凳
SiGre 发表于 2017-5-1 08:27:54
黃河泉 发表于 2017-4-30 16:41
Not exactly! 有时我们需要两个或以上之变量来合并数据!
需要是需要,但是目前没有数据库处理软件或语音能够用两个或以上的key或者identity来合并数据。如果你知道有,请赐教

报纸
蓝色 发表于 2017-5-1 09:12:16
SiGre 发表于 2017-5-1 08:27
需要是需要,但是目前没有数据库处理软件或语音能够用两个或以上的key或者identity来合并数据。如果你知道 ...
当然可以2个以上的了http://www.princeton.edu/~otorres/Merge101.pdf


看清楚,merge的help明确写的是varlist  ,这是变量列表,是多个变量;不是varname
Title
    [D] merge -- Merge datasets
Syntax
    One-to-one merge on specified key variables
       merge 1:1 varlist  using filename [, options]





你可以看看histogram,这个命令才只能跟一个变量
  [R] histogram -- Histograms for continuous and categorical variables
Syntax
        histogram varname [if] [in] [weight] [, [continuous_opts | discrete_opts] options]


地板
SiGre 发表于 2017-5-1 09:31:32
蓝色 发表于 2017-5-1 09:12
当然可以2个以上的了http://www.princeton.edu/~otorres/Merge101.pdf
谢谢回复。你发的PDF我看了,但是我想您没有理解我的意思。假设有两个数据库,每个观测值缺少唯一的id,但是可以由两个或以上的字段决定唯一一条数据。这里必须使用merge 1:1,但是varlist没有唯一确定的变量无法实现合并(stata报错缺少uniquely specified variable)。我当时想合并的是两个面板数据,穷尽我的编程知识数据库知识都没有找到合并的软件或者语言。我个人认为当前的大部分数据操作程序都需要一个唯一确定的id实现一对一合并。请指正。

7
momodomo 发表于 2017-5-1 10:14:11 来自手机
weishoudao 发表于 2017-4-24 21:07
如上图,将0.dta和15.dta均放在F:\3下,两个文件里面均含有reportername productcode partnername year这 ...
你合并操作没错,是主键太多了,两个文件里面没有全部主键一致的数据,所以_merge=3的个数为零

8
蓝色 发表于 2017-5-1 15:01:53
SiGre 发表于 2017-5-1 09:31
谢谢回复。你发的PDF我看了,但是我想您没有理解我的意思。假设有两个数据库,每个观测值缺少唯一的id,但 ...
数据是可以唯一确定的
关键是你的搞清楚你的数据

9
黃河泉 在职认证  发表于 2017-5-1 15:20:16
1. 奇怪,代码 <> 的功能好像坏了!2. 假设我们有两个面板资料
    +--------------------+
     | id   year   invest |
     |--------------------|
  1. |  1   1951    755.9 |
  2. |  1   1952    891.2 |
  3. |  1   1953   1304.4 |
  4. |  1   1954   1486.7 |
  5. |  2   1951    588.2 |
  6. |  2   1952    645.5 |
  7. |  2   1953      641 |
  8. |  2   1954    459.3 |
     +--------------------+

     +--------------------+
     | id   year   mvalue |
     |--------------------|
  1. |  1   1951     4833 |
  2. |  1   1952   4924.9 |
  3. |  1   1953   6241.7 |
  4. |  1   1954   5593.6 |
  5. |  2   1951   2289.5 |
  6. |  2   1952   2159.4 |
  7. |  2   1953   2031.3 |
  8. |  2   1954   2115.5 |
     +--------------------+
我们可用 merge 1:1 id year 之类的指令合并两个档!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-23 15:00