楼主: peyzf
3104 2

[Stata高级班] 请教有关于将字符型变量变成数值型变量 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2012-12-23 16:56:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

有一变量,本为数值型,但其中包含了几个记录为非数值型,如+|,因此,转入stata中,整个变量被定义为字符型。如果数据量非常大,通过肉眼基本上无法完全识别哪些记录中含有非数值的记录,即可能还含有其它比较奇怪的记录,如#¥等,如何通过程序来查找?最终将该变量其变成数值型变量?


您上次在问题中建议逐一识别,但如果数据量非常巨大,逐一检查的效率是很低的,有没有相关的程序来处理。


我还发现有些记录为空格,但我不确定其为几个空格,如何将其统一改成"."缺省值?

stata对记录为空格与"."的处理方式有何差别?


谢谢。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:字符型变量 字符型 数值型 Stata tata 记录 如何

沙发
arlionn 在职认证  发表于 2012-12-25 23:48:26
第一个问题,stata 初级班有详细介绍。
help destring
重点看看 ignore() 选项。
给个 Stata 初级视频中的例子:
destring code,     gen(code1) ignore(" ")

如果原始变量是数值型的,则空格在导入过程中会被自动识别为缺漏值。
看你的情况,原始变量是文字型的,那就需要处理一下。

总体而言,你可以尝试如下命令(手头没有数据,只是大概的命令,还需你仔细斟酌一下):
destring x, gen(x1) ignore("+,| ")

藤椅
peyzf 发表于 2012-12-26 02:37:35
thanks.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 05:43