楼主: gavin4403
915 2

[数据管理求助] 数据重复管理 [推广有奖]

  • 2关注
  • 0粉丝

博士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
640 个
通用积分
30.6300
学术水平
11 点
热心指数
14 点
信用等级
10 点
经验
4447 点
帖子
170
精华
0
在线时间
238 小时
注册时间
2007-4-27
最后登录
2024-10-4

楼主
gavin4403 发表于 2016-5-5 12:54:32 |AI写论文
10论坛币
我在导入数据时由于手工操作失误,导致code(证券代码)输入错误。即:
真实的数据为:
code        year        asset
000001    2001        231
000001    2002        234
000001    2003        222
000002    2001       111
000002    2002       100
000002    2003        99
结果在导入数据时将code=000001的数据全部赋予了code=000002,即
code        year        asset
000001    2001        231
000001    2002        234
000001    2003        222
000002    2001        231
000002    2002        234
000002    2003        222
我的问题是如何挑出这些除了code不同外 ,year和asset全部相同的两组或多组数据。这样就可以重新更正数据了。



P.S.造成上述问题的原因是,将code=000001的数据下载下来后保存为000001.xls。由于操作失误,然后重复下载了code=000001的数据,但是,却保存为了000002.xls。所以,就导致出现code不同,但是,year和asset相同的情况。
现在,为了确保数据真实准确,所以,我需要挑出code不同,而year和asset全部相同的数据,重新核对和更正。



望请高手不吝赐教。谢谢。





关键词:Asset 相同的数据 code year 导入数据 如何 手工 证券

沙发
dqlcsm 发表于 2016-5-6 16:30:31
可以用egen=tag(year asset)

藤椅
gavin4403 发表于 2016-5-6 17:31:53
dqlcsm 发表于 2016-5-6 16:30
可以用egen=tag(year asset)
tag()函数生成的变量给每组第一个观测值赋值为1,其它值或在其它情况下(如果不满足if条件下)为0。这不能解决我的问题。但是,非常感谢您的回答。谢谢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-18 02:39