楼主: myq9861
8839 19

[讨论]如何把数据表中的重复数据项删去 [推广有奖]

  • 1关注
  • 0粉丝

已卖:492份资源

硕士生

54%

还不是VIP/贵宾

-

威望
0
论坛币
156 个
通用积分
1.1600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2764 点
帖子
84
精华
0
在线时间
224 小时
注册时间
2007-12-25
最后登录
2025-3-10

楼主
myq9861 发表于 2008-5-18 21:42:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如何把数据表中的重复数据项删去

两张表:一个企业家的基本情况表,另一个企业的情况表,我想把两个表合二为一,我知道是用merge这个命令,以企业名称为排序的关键字,但是一其中一个表中发现有重复的数据项,不知道怎么去掉?请哪位高手指点一下,谢谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据表 重复数 Merge 合二为一 基本情况 数据 讨论 删去

回帖推荐

Leokeeper 发表于4楼  查看完整内容

duplicates drop varible(有重复数据的那个变量)建议你看看版上陈传波老师那个中文教程,很简单的。

myq9861 发表于16楼  查看完整内容

谢谢高手指导,试过了,这样可以让每一行全为了0的observation去掉,但是有个小问题:如果我的某一个样本数据中的若干个变量中只有一个变量值为0的话,那么运行上一段程序后,这一行的数据就全部被删了,不知道我试的对不对,而在实际操作中这样的数据是不是就被删了,还是保留估计也没有一个标准,可能有时候还是要留下来,如果样本数量少的话,呵呵~感谢各位高手指点。

richardqmul 发表于17楼  查看完整内容

用以下的命令countcompressdrop if (var1==0)*(var2==0)*(var3==0)*(var4==0)*(var5==0)*(var6==0) in 1/lcount

本帖被以下文库推荐

沙发
waterup 发表于 2008-5-18 22:23:00
这个不难,excel里写个小程序就搞定了,好像spss里有剔出重复数据的选项,stata里没注意过

藤椅
myq9861 发表于 2008-5-18 22:47:00
我后来在EXCEL里先解决了,然后再导到STATA里去弄的,不过,又出现了一个新的问题:在从STATA的导出数据时,导出格式为EXCEL格式,在EXCEL表中的表头显示的是变量名,而我要的是标签,因为我从EXCEL格式用insheet导入到STATA中时,EXCEL中表头出现在数据表里就是标签,为什么导入后再导出就成了变量名,而不是标签呢?谢谢

板凳
Leokeeper 发表于 2008-5-18 23:38:00

duplicates drop varible(有重复数据的那个变量)

建议你看看版上陈传波老师那个中文教程,很简单的。

已有 1 人评分论坛币 热心指数 收起 理由
crystal8832 + 5 + 1 我很赞同

总评分: 论坛币 + 5  热心指数 + 1   查看全部评分

http://www.soudoc.com/bbs/?u=135811

报纸
cpine2000 发表于 2008-5-19 02:53:00
楼上正解,duplicates足矣

地板
myq9861 发表于 2008-5-19 09:57:00

谢谢各位告诉我是用duplicates这个命令,我查询了帮助,知道怎么用了,现在的问题还在第三楼我提到的那个:

用insheet 命令导入数据时,在EXCEL表中的每个样本数据都有一个变量名(比如说企业名称、企业职工人数等),到STATA的表里就成了标签,变量名成了系统默认的v1,v2,。。。,然后横向合并数据后,再用outsheet导出时,出来的就是v1,v2,...等这些变量名,而不是我原先导入到STATA表中的变量名了(比如说企业名称、企业职工人数等),而我需要出来的是标签,这样好看,因为数据的变量名(比如说企业名称、企业职工人数等)太多,有90多个,所以无法用手工的方法来解决。

我查过outsheet帮助命令了,里面没有输出标签的这个option,只有不输出标签的nolabel这个option,不知道有没有办法解决,谢谢

7
Leokeeper 发表于 2008-5-19 13:00:00
stata 不识别中文,建议换成英文变量名
http://www.soudoc.com/bbs/?u=135811

8
myq9861 发表于 2008-5-19 20:39:00

好的,谢谢,只是原来 的表里都是中文,想想还是在EXCEL里做吧

9
liujiafei 发表于 2008-5-20 00:31:00
软件都有自己的长处和短处,有些数据预处理问题使用spss、excel处理会更方便

10
永恒的凤凰木 发表于 2008-5-21 00:28:00

的确,STATA的基础数据处理能力还不及EXCEL和SPSS方便~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-28 11:23