楼主: guokuidai
10237 13

[统计软件与数据分析] 关于实证分析中数据预处理的问题 [推广有奖]

11
ljcwsh 发表于 2016-5-23 09:26:12
guokuidai 发表于 2016-5-19 08:48
可否请问具体异常值与极值的处理方法呢?是均值加减3倍标准差?还是用箱图确定呢?
在公司金融领域中,常用的是winsorize的方法,在99%或者90%的分位数处winsor一下,就把尾部的异常值全部一致化为相应的位置的值了。不过具体的情况还需要具体应用的分析。这个本就是非常具有弹性的问题。相关的教材的话,建议先把软件学会,比如little sas book,这些软件用熟了之后需要的就是按照你自己的思路来清洗数据,所以掌握软件是最重要的

12
944536616@qq.co 发表于 2016-5-26 00:07:39
主要是检查数据一致性,处理无效值和缺失值等,删除重复信息、纠正存在的错误,并提供数据一致性。
1、首先看数据类型,是定性变量还是定量的,即字符型的还是数字型的变量
2、根据样本量,即行,有几条记录
3、统计量是不是有异常值,超出3个标准差?缺失严重否,是否需要用均数或者中位数填补
4、是否有逻辑错误
5、统计描述,proc means 或者 freq 过程做出直条图或者直方图,进行描述
6、对不符合要求的,进行处理
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
admin_kefu + 20 热心帮助其他会员
guokuidai + 5 + 2 + 2 + 2 观点有启发

总评分: 论坛币 + 25  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

13
苦鬼2014 学生认证  发表于 2016-6-6 20:01:06 来自手机
guokuidai 发表于 2016-5-18 17:06
RT,各位在用软件跑数据前,是如何对数据进行预处理的?缺失值,异常值,数据变换……?欢迎讨论,集思广益 ...
请问应该用什么工具软件实现预处理呢?除了异常值和缩尾处理之外,是否用excel计算呢?比如计算权益资本成本,操纵性应计等。

14
苦鬼2014 学生认证  发表于 2016-6-6 20:02:04 来自手机
guokuidai 发表于 2016-5-20 11:13
请问是否有关于实证研究前的数据清洗的教材呢?想系统性的学习下!
关注,一般介绍了跑数据的方法,预处理却没有细讲。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-10 15:26