楼主: 木牛流马0
1956 13

[数据管理求助] 列出数据中的重复值(交集) [推广有奖]

  • 2关注
  • 0粉丝

讲师

20%

还不是VIP/贵宾

-

威望
0
论坛币
2680 个
通用积分
140.0773
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2616 点
帖子
128
精华
0
在线时间
717 小时
注册时间
2016-7-17
最后登录
2026-1-23

楼主
木牛流马0 学生认证  发表于 2021-1-5 15:22:07 |AI写论文
10论坛币
请问如何能新增一列,列出在所有列中都有的重复值(交集)。数据示例如下:
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input strL(var1 var2 var3 var4 var5 var11 var13 var15 var17 var19)
  4. "北京"       "北京"       "北京"       "北京"       "北京"       "北京"       "北京"       "北京"       "北京"       "北京"      
  5. "天津"       "天津"       "天津"       "天津"       "天津"       "天津"       "天津"       "天津"       "天津"       "天津"      
  6. "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市" "石家庄市"
  7. "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"    "唐山市"   
  8. "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"    "邯郸市"   
  9. "张家口市" "张家口市" "张家口市" "张家口市" "张家口市" "张家口市" "张家口市" "张家口市" "张家口市" "张家口市"
  10. "保定市"    "保定市"    "保定市"    "保定市"    "保定市"    "保定市"    "保定市"    "保定市"    "保定市"    "保定市"   
  11. "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"    "沧州市"   
  12. "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市" "秦皇岛市"
  13. "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"    "邢台市"   
  14. end
复制代码

最佳答案

黃河泉 查看完整内容

类似这样吗?
关键词:重复值 generated generate install example
努力做一个不断向上的科研人

沙发
黃河泉 在职认证  发表于 2021-1-5 15:22:08
木牛流马0 发表于 2021-1-5 17:12
以下面数据来说,我本有v1、v2、v3、v4四列数据,vnew是我想得到的数据,即v1、v2、v3、v4都有的变量。
类似这样吗?
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6(v1 v2 v3 vnew)
  4. "北京" "北京" "北京" "北京"
  5. "上海" "上海" "上海" "上海"
  6. "天津" "重庆" "武汉" "重庆"
  7. "重庆" "武汉" "重庆" ""      
  8. end

  9. drop vnew
  10. stack v1-v3, group(3)
  11. encode v1, gen(d)
  12. collapse (count) vnew=d, by(v1)
  13. drop if vnew < 3
复制代码

藤椅
zdlspace 学生认证  发表于 2021-1-5 15:37:54
如果我没看错,你这所有列的城市都是一样的,也就是说都是重复的?

板凳
木牛流马0 学生认证  发表于 2021-1-5 15:40:58
zdlspace 发表于 2021-1-5 15:37
如果我没看错,你这所有列的城市都是一样的,也就是说都是重复的?
对,这里截取的数据都是重复的,但是剩下的数据有不一样的,我是想找出他们的交集来。

报纸
黃河泉 在职认证  发表于 2021-1-5 16:04:58
看不太懂你的说明与要的东西,请利用你的资料说明一下!

地板
zdlspace 学生认证  发表于 2021-1-5 16:11:19
黃河泉 发表于 2021-1-5 16:04
看不太懂你的说明与要的东西,请利用你的资料说明一下!
他的意思是,提取所有变量中都包含的城市,比如var1-var19中都有北京、天津、石家庄这3个城市,那么把这三个城市提取出来放在一列中。

7
木牛流马0 学生认证  发表于 2021-1-5 16:23:50
黃河泉 发表于 2021-1-5 16:04
看不太懂你的说明与要的东西,请利用你的资料说明一下!
我的要求就是求交集。假设我截取的数据有10列,10列中都有北京,10列中只有9列有保定,那么新建一列,其中应包含北京,不包含保定。

8
黃河泉 在职认证  发表于 2021-1-5 16:57:09
zdlspace 发表于 2021-1-5 16:11
他的意思是,提取所有变量中都包含的城市,比如var1-var19中都有北京、天津、石家庄这3个城市,那么把这三 ...
我还是看不懂。

9
黃河泉 在职认证  发表于 2021-1-5 16:57:29
木牛流马0 发表于 2021-1-5 16:23
我的要求就是求交集。假设我截取的数据有10列,10列中都有北京,10列中只有9列有保定,那么新建一列,其 ...
我还是看不懂。

10
木牛流马0 学生认证  发表于 2021-1-5 17:12:01
黃河泉 发表于 2021-1-5 16:57
我还是看不懂。
以下面数据来说,我本有v1、v2、v3、v4四列数据,vnew是我想得到的数据,即v1、v2、v3、v4都有的变量。
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6(v1 v2 v3 vnew)
  4. "北京" "北京" "北京" "北京"
  5. "上海" "上海" "上海" "上海"
  6. "天津" "重庆" "武汉" "重庆"
  7. "重庆" "武汉" "重庆" ""      
  8. end
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-5 03:14