楼主: 奇犽dsp
7880 18

[数据管理求助] 使用duplicates删除重复数据后仍存在重复数据 [推广有奖]

教授

37%

还不是VIP/贵宾

-

TA的文库  其他...

资源

stata学习

阅读的论文

威望
0
论坛币
264168 个
通用积分
5239.9131
学术水平
313 点
热心指数
399 点
信用等级
318 点
经验
14435 点
帖子
1295
精华
0
在线时间
940 小时
注册时间
2015-11-28
最后登录
2024-7-17

初级热心勋章 中级热心勋章

50论坛币
如图所示,使用duplicates drop time, force之后,发现处理后的数据仍然存在重复的时间。
附件中是样本数据。
请大家帮忙解决一下,谢谢


36551161014786536.png

date.dta (26.51 KB)

最佳答案

关键词:duplicates duplicate 重复数 ICA ATE
【版规】“文献求助专区”版规(试行版) :https://bbs.pinggu.org/thread-4820326-1-1.html
【回帖奖励3论坛币】https://bbs.pinggu.org/forum.php?mod=viewthread&tid=6274240&page=1&extra=#pid49869790
沙发
黃河泉 在职认证  发表于 2017-12-4 16:59:08 |只看作者 |坛友微信交流群
我试过
  1. . list

  2.      +-----------------------------+
  3.      | ticker                 time |
  4.      |-----------------------------|
  5.   1. | 000826   03feb2017 09:30:00 |
  6.   2. | 000786   03feb2017 09:30:59 |
  7.      +-----------------------------+
复制代码

使用道具

藤椅
奇犽dsp 学生认证  发表于 2017-12-4 17:02:58 |只看作者 |坛友微信交流群
也可说是duplicates计数不准确。
请问是stata自不能识别一些相同的时间吗?还是说stata显示的时间只到了秒,实际上是精确到毫秒,时间的毫秒不相同引起的重复数据删除不完全。请问如果是这样,那应该怎么样将时间都四舍五入到分钟呢?

介绍一下该数据背景:
为不同股票的以分钟数据为单位的股价等基本信息,所以值得注意的是分钟时间。

使用道具

板凳
奇犽dsp 学生认证  发表于 2017-12-8 12:47:55 |只看作者 |坛友微信交流群
这个问题我想我已经解决了。
我浏览到一些资料显示,在stata中使用force语句会造成一些问题,不能完全删除重复值。
于是我尝试了用删除重复值之后的数据(duplicates drop time,force),将两个time显示时间一模一样的值用scatter作图,结果发现图形显示是一个time时间点。
不知这样是否正确,请各位指点。
【版规】“文献求助专区”版规(试行版) :https://bbs.pinggu.org/thread-4820326-1-1.html
【回帖奖励3论坛币】https://bbs.pinggu.org/forum.php?mod=viewthread&tid=6274240&page=1&extra=#pid49869790

使用道具

报纸
奇犽dsp 学生认证  发表于 2018-1-4 09:24:49 |只看作者 |坛友微信交流群
奇犽dsp 发表于 2017-12-8 12:47
这个问题我想我已经解决了。
我浏览到一些资料显示,在stata中使用force语句会造成一些问题,不能完全删除 ...
请问大家我这样想是不是正确呢?

使用道具

地板
黃河泉 在职认证  发表于 2018-1-4 09:41:31 |只看作者 |坛友微信交流群
奇犽dsp 发表于 2018-1-4 09:24
请问大家我这样想是不是正确呢?
尔后建议请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

使用道具

7
奇犽dsp 学生认证  发表于 2018-1-4 09:44:02 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-1-4 09:41
尔后建议请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料 ...
老师,原贴主题上就有dataex,请老师过目。谢谢

使用道具

8
黃河泉 在职认证  发表于 2018-1-4 09:45:11 |只看作者 |坛友微信交流群
奇犽dsp 发表于 2018-1-4 09:44
老师,原贴主题上就有dataex,请老师过目。谢谢
没看到!

使用道具

9
奇犽dsp 学生认证  发表于 2018-1-4 10:07:53 |只看作者 |坛友微信交流群
黃河泉 发表于 2018-1-4 09:45
没看到!
date.rar (6.17 KB) 本附件包括:
  • date.dta

【版规】“文献求助专区”版规(试行版) :https://bbs.pinggu.org/thread-4820326-1-1.html
【回帖奖励3论坛币】https://bbs.pinggu.org/forum.php?mod=viewthread&tid=6274240&page=1&extra=#pid49869790

使用道具

10
黃河泉 在职认证  发表于 2018-1-4 10:36:22 |只看作者 |坛友微信交流群
奇犽dsp 发表于 2018-1-4 10:07
尔后建议请用 dataex (先 ssc install dataex 并见说明) 将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html
已有 1 人评分学术水平 热心指数 收起 理由
奇犽dsp + 1 + 3 观点有启发

总评分: 学术水平 + 1  热心指数 + 3   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 18:46