楼主: xx3050
15495 3

stata如何将数据分开,如何将其中包含某个东西的去掉 [推广有奖]

  • 1关注
  • 1粉丝

讲师

38%

还不是VIP/贵宾

-

威望
0
论坛币
1525 个
通用积分
24.9880
学术水平
5 点
热心指数
5 点
信用等级
3 点
经验
30873 点
帖子
279
精华
0
在线时间
680 小时
注册时间
2008-11-17
最后登录
2020-8-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
可能说的不太清楚,举个例子
1.
是这样的
如v1数据为
20110901
20110902

这样的日期数据,我想分为v1_1 :
2011
2011

v1_2:
0901
0902

就是将v1分成v1_1和v1_2;

2.这列数据是字符型,有的数据从excel中导入过来就包含有“,”这个逗号,用来分割千位这种,如2,199,000,这个小逗号。我想将这列数据变为数值型,但是如果force replace的话,这些带有小逗号的值就会成为空,该用什么命令先将这个小逗号去掉?
如:2,416.36
2,316.36
2,318.75
将它们变成2416.36,去掉小逗号


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata replace Force place 如何

回帖推荐

grmorpheus 发表于3楼  查看完整内容

对于第二个问题 还有一个比较简便的处理方式 一般带逗号的数据考入到stata里 stata一般都会默认为字符型,这个时候可以直接转换成数值型并且去掉逗号 用 命令 destring var, ignore(“,”), 就能把 11,111.0这样的字符型转换为 11111.0的数值型了

a2melbourne 发表于2楼  查看完整内容

问题一, 假如你的变量是var1, 数据是字符: gen var2=substr(var1,1,4) gen var3=substr(var1, 5,.) 假如你的数据不是字符: tostring var1, gen(var2) gen var3=substr(var1,1,4) gen var4=substr(var1, 5,.) 如果你想要分开的两个变量成为数据,再用destring回去 destring var3, gen(var5) destring var4, gen(var6) drop var3 var4 问题二, 既然你是excel里面来的数据,简单的就是在excel里面吧数 ...
沙发
a2melbourne 发表于 2011-11-10 21:10:02 |只看作者 |坛友微信交流群
问题一,

假如你的变量是var1, 数据是字符:

gen var2=substr(var1,1,4)
gen var3=substr(var1, 5,.)

假如你的数据不是字符:

tostring var1, gen(var2)
gen var3=substr(var1,1,4)
gen var4=substr(var1, 5,.)

如果你想要分开的两个变量成为数据,再用destring回去

destring var3, gen(var5)
destring var4, gen(var6)
drop var3 var4

问题二,
既然你是excel里面来的数据,简单的就是在excel里面吧数据格式改成不带逗号的,然后再粘贴回来。
当然在stata里面也能实现。

先把数字转换成字符,然后替换,在转换回来,还是假设你的变量叫var1

tostring var1, gen(var2)
replace var2=subinstr(var2,",","",.)
destring var2, gen(var3)
drop var1 var2

使用道具

藤椅
grmorpheus 发表于 2011-11-10 23:15:47 |只看作者 |坛友微信交流群
对于第二个问题 还有一个比较简便的处理方式 一般带逗号的数据考入到stata里 stata一般都会默认为字符型,这个时候可以直接转换成数值型并且去掉逗号 用 命令  destring var, ignore(“,”), 就能把
11,111.0这样的字符型转换为 11111.0的数值型了

使用道具

板凳
jordan1963217 发表于 2012-11-24 16:47:05 |只看作者 |坛友微信交流群
stata有一个变量中的数据由 “董事,CEO”;“CEO”;“CEO,财务总监”;”财务总监“等构成
有没有什么命令可以把含有"CEO"的观测值提出来?
谢谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 00:12