楼主: 神月德
4087 12

[数据管理求助] 如何删除一个变量中的重复字符 [推广有奖]

  • 1关注
  • 0粉丝

本科生

67%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
837 点
帖子
52
精华
0
在线时间
99 小时
注册时间
2015-9-17
最后登录
2018-9-6

楼主
神月德 发表于 2015-9-19 23:56:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
4,4,5,6生成4,5,6
5,5,5,5生成5
1,3,1生成1,3
1,1生成1
请问这样的命令怎么写
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何

回帖推荐

沙发
夏目贵志 发表于 2015-9-20 04:55:09
  1. clear
  2. set obs 4
  3. gen x="4,4,5,6" in 1
  4. replace x="5,5,5,5" in 2
  5. replace x="1,3,1" in 3
  6. replace x="1,1" in 4
  7. gen tmp=""
  8. gen result=""
  9. forvalues i=1/4 {
  10.         replace tmp=""
  11.         local list = subinstr(x[`i'],","," ",.)
  12.         local obs = 1
  13.         foreach value in `list' {
  14.                 replace tmp = "`value'" in `obs'
  15.                 local obs = `obs' + 1
  16.         }
  17.         levelsof tmp, clean
  18.         replace result = r(levels) in `i'
  19. }
  20. drop tmp
  21. list x result
复制代码
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
hustchen2012 + 10 + 10 + 1 + 1 + 1 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
神月德 发表于 2015-9-20 08:51:34
夏目贵志 发表于 2015-9-20 04:55
你好,我这里有10万个这样的无规则数据,这个命令可能不他适合,请问还有其他的命令吗

板凳
蓝色 发表于 2015-9-20 12:26:56
你这样的数据没有重复了以后,怎么使用啊

报纸
luckykong 发表于 2015-9-20 14:55:52
神月德 发表于 2015-9-20 08:51
你好,我这里有10万个这样的无规则数据,这个命令可能不他适合,请问还有其他的命令吗
十万个无规则数据,是什么意思?
是说有十万行数据?还是说某一个观测值会有十万个字符?

地板
andruw 在职认证  发表于 2015-9-20 17:30:48
两种方法:
1. 如果楼主的数据中只有数字,只需一行代码。用cond和substr。

2. 如果楼主数据比较复杂,包含字符和数字以及符号。用split和reshape。


另外,为何代码上传老出现错误?
已有 1 人评分经验 论坛币 学术水平 热心指数 收起 理由
夏目贵志 + 10 + 10 + 1 + 1 split确实是比较好的方法

总评分: 经验 + 10  论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

7
夏目贵志 发表于 2015-9-20 21:38:10
神月德 发表于 2015-9-20 08:51
你好,我这里有10万个这样的无规则数据,这个命令可能不他适合,请问还有其他的命令吗
这个是抛砖引玉罢了。并不是效率最高的做法。但是作为一种处理数据的思路我觉得还是有益的。其实十万个并不多,除非你需要定时做这个(比如每天一次),否则效率问题倒也不是最优先的考虑。

8
夏目贵志 发表于 2015-9-20 21:39:23
andruw 发表于 2015-9-20 17:30
两种方法:
1. 如果楼主的数据中只有数字,只需一行代码。用cond和substr。
的确,如果有关于原始数据的更多信息,可以想到更简便的方法。

发代码有什么问题?

9
andruw 在职认证  发表于 2015-9-20 21:59:15
夏目贵志 发表于 2015-9-20 21:39
的确,如果有关于原始数据的更多信息,可以想到更简便的方法。

发代码有什么问题?
老是显示“小伙伴出错了”。。。

10
夏目贵志 发表于 2015-9-20 22:07:35
andruw 发表于 2015-9-20 21:59
老是显示“小伙伴出错了”。。。
这个。。。我还从没见过。。。我最近老是遇到论坛说我是机器人,要我输验证码。。。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 05:24