楼主: wonway
6458 9

[数据管理求助] [原创]用stata操作两个csv文件中的内容 [推广有奖]

  • 0关注
  • 4粉丝

硕士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
801 个
通用积分
54.0353
学术水平
1 点
热心指数
2 点
信用等级
1 点
经验
2181 点
帖子
129
精华
0
在线时间
121 小时
注册时间
2008-4-13
最后登录
2022-5-2

楼主
wonway 发表于 2009-5-21 11:22:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

请问如何用stata操作两个csv文件中的内容啊?

stata能不能自定义数组呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 自定义 如何用 文件 Stata Stata CSV CSV 原创

沙发
sungmoo 发表于 2009-5-21 11:34:00
你要完成什么任务呢?

藤椅
wonway 发表于 2009-5-21 14:11:00

我有两组数据,一组是首发上市的公司列表信息,另一组是各个年度各家公司的财务数据,我想将两个文件通过股票代码汇合,筛选出特定年份上市的那些公司~如果用merge的话又只能设置一对一的融合 如果各家公司的财务数据多于一年的话就没办法用了

[此贴子已经被作者于2009-5-21 14:13:04编辑过]

板凳
sungmoo 发表于 2009-5-21 14:56:00

没太看懂你的表述。

不知是否与https://bbs.pinggu.org/thread-460298-1-1.html中的问题类似?

已有 1 人评分经验 收起 理由
SpencerMeng + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

报纸
wonway 发表于 2009-5-21 17:18:00

知道了!非常感谢!!!

地板
wonway 发表于 2009-5-21 17:53:00

不好意思,我用回自己的数据的话还是会有问题,我是把listed2作为group文件,listedall作为com文件,可是就不是能识别list2中的变量,运行日志附件所示,能否指点一下我的程序到底问题是出在哪里了呢?

-----------------------------------------------------------------------------------------------------------------------
       log:  F:\ivy\list2.log
  log type:  text
 opened on:  21 May 2009, 17:43:12

. insheet using "F:\ivy\listed2.csv"
(4 vars, 318 obs)

. save "F:\ivy\listed2.dta",replace
file F:\ivy\listed2.dta saved

.
. clear all

. insheet using "F:\ivy\listedall.csv"
(4 vars, 6555 obs)

. save "F:\ivy\listedall.dta",replace
file F:\ivy\listedall.dta saved

.
. joinby using "F:\ivy\listed2.dta",update unm(both)
join on common variables: v1 v2 v3 v4

.
. list in 1/20

     +---------------------------------------------------------+
     | v1     v2         v3           v4                _merge |
     |---------------------------------------------------------|
  1. |  2   2002    深万科A    5.200e+08   only in master data |
  2. |  2   2003    深万科A    8.304e+08   only in master data |
  3. |  2   2004    深万科A    1.260e+09   only in master data |
  4. |  2   2005   G万科A    1.976e+09   only in master data |
  5. |  2   2006      万科A    3.397e+09   only in master data |
     |---------------------------------------------------------|
  6. |  4   2002   北大高科      8592439   only in master data |
  7. |  4   2003   北大高科    8773926.7   only in master data |
  8. |  4   2004   北大高科   -4015379.5   only in master data |
  9. |  4   2005   国农科技    -20395735   only in master data |
 10. |  4   2006    *ST国农    6396100.3   only in master data |
     |---------------------------------------------------------|
 11. |  5   2002   世纪星源   -1.236e+08   only in master data |
 12. |  5   2003     ST星源    -47588165   only in master data |
 13. |  5   2004     ST星源    -38966299   only in master data |
 14. |  5   2005     ST星源   -2.282e+08   only in master data |
 15. |  5   2006     ST星源    -50411206   only in master data |
     |---------------------------------------------------------|
 16. |  6   2002    深振业A    1.034e+08   only in master data |
 17. |  6   2003    深振业A   -3.024e+08   only in master data |
 18. |  6   2004    深振业A     50144559   only in master data |
 19. |  6   2005    深振业A    1.166e+08   only in master data |
 20. |  6   2006    深振业A    2.531e+08   only in master data |
     +---------------------------------------------------------+

.
. list if  v1==100

      +---------------------------------------------------------+
      |  v1     v2        v3           v4                _merge |
      |---------------------------------------------------------|
 313. | 100   2003   TCL集团    1.352e+09   only in master data |
 314. | 100   2004   TCL集团     20040130    only in using data |
 315. | 100   2004   TCL集团    2.888e+08   only in master data |
 316. | 100   2005   TCL集团   -1.465e+09   only in master data |
 317. | 100   2006   TCL集团   -3.569e+09   only in master data |
      +---------------------------------------------------------+

.
. capture log close

328016.rar (79.2 KB)

[此贴子已经被作者于2009-5-21 18:02:53编辑过]

7
sungmoo 发表于 2009-5-21 18:55:00

  
cd "F:\ivy"
clear
tempfile d
insheet using listed2.csv
ren v1 id
ren v2 pyear
ren v3 gname
ren v4 pdate
save `d'
clear
insheet using listedall.csv
ren v1 id
ren v2 year
ren v3 cname
ren v4 profit
joinby id using `d',unm(b)

*你看是不是要以上结果。(注意变量_merge取值的标识意义)


eblog  金币 +3  金钱 +50  奖励 2009-5-21 22:37:26

8
wonway 发表于 2009-5-21 20:29:00
嗯嗯 搞定了 原来变量v1 v2等是一定要改成具体的名字才行的!谢谢sungmoo版主!

9
sungmoo 发表于 2009-5-21 20:30:00
以下是引用wonway在2009-5-21 20:29:00的发言:原来变量v1 v2等是一定要改成具体的名字才行的

joinby是根据两库同名变量合并的,因此,应该让两库同名变量有相同意义。

10
peyzf 发表于 2014-11-12 17:33:47
learning.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 00:20