楼主: 安州木
898 1

[经济学基础] Stata数据缺失如何处理? [推广有奖]

  • 0关注
  • 2粉丝

讲师

10%

还不是VIP/贵宾

-

威望
0
论坛币
4708 个
通用积分
44.4192
学术水平
80 点
热心指数
80 点
信用等级
80 点
经验
11137 点
帖子
145
精华
0
在线时间
337 小时
注册时间
2023-7-12
最后登录
2024-6-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Stata数据缺失如何处理?

1.首先判断是否存在缺失值:


(1)使用codebook命令:

codebook VAR1 VAR2 ……


//统计每个变量的详细情况,其中有缺失情况

--------------------------------

v1                   (unlabeled)

--------------------------------


type:  numeric (float)

range:  [1,1]    units: 1

unique values:1  missing .:  0/80

tabulation:  Freq.  Value

                   80        1



(2)使用missing命令:

gen missing1=missing(VAR1 VAR2)


//生成missing1新变量,当VAR中的任一变量有缺失值的时候,missing值为1,否则为0



(3)使用nmissing/npresent命令:

ssc install nmissing  //安装外部命令nmissing

ssc install npresent  //安装外部命令npresent

nmissing                //统计数据缺失的变量

npresent                //统计没有数据缺失的变量



(4)使用mdesc命令:

mdesc                  //显示缺失值数量,总数量以及缺失比例



2.对缺失值进行处理


(1)在财务领域,我们一般不对缺失值进行插值等补充处理,缺失值也不会对我们的结论产生较大的影响。


(2)我们会将具有缺失值的样本剔除出我们的观测样本,命令如下:

gen missing1=missing(VAR1 VAR2)  //生成虚拟变量

keep if missing1==0                      //仅保留没有缺失值的数据


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:STATA数据 Stata 数据缺失 tata codebook

已有 1 人评分经验 论坛币 收起 理由
linmengmiki + 100 + 100 鼓励积极发帖讨论

总评分: 经验 + 100  论坛币 + 100   查看全部评分

沙发
majunyuan 学生认证  发表于 2024-2-6 16:41:50 |只看作者 |坛友微信交流群
在数据缺失不是很严重的情况下,有很多种方法,这属于数据预处理(或者叫数据清洗),常见的方法就是上方的插值法(取平均值或者用曲线拟合后再取值),高级一点的数学建模层次就是神经网络的方法(就是通过计算机不断遍历尝试去取值),论文常用前者。当然还有一些其他方法
已有 1 人评分经验 论坛币 收起 理由
linmengmiki + 100 + 100 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 100   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-7-27 08:58