请选择 进入手机版 | 继续访问电脑版
楼主: Captain-CUI
112588 137

[学习心得] 初学者如何把面板数据导入到Stata中     [分享]

学术权威

85%

还不是VIP/贵宾

-

TA的文库  其他...

Stata小问题

Shibor

威望
6
论坛币
548518 个
通用积分
25453.4352
学术水平
2608 点
热心指数
2883 点
信用等级
2418 点
经验
342991 点
帖子
5852
精华
19
在线时间
2293 小时
注册时间
2014-10-6
最后登录
2021-3-24

初级学术勋章 中级热心勋章 初级热心勋章 中级学术勋章 高级学术勋章 高级热心勋章 初级信用勋章 中级信用勋章 特级热心勋章 高级信用勋章 特级学术勋章

Captain-CUI 学生认证  发表于 2016-11-29 14:40:16 |显示全部楼层

对于Stata初学者而言,把面板数据顺利的导入到Stata中,过程是比较“艰辛”的!但是如果你能够迈过这个坎,那么你的Stata实际操作将有一个显著的提升,对于Stata的数据格式也会有更深的理解。要想把数据输入到Stata中,你首先要知道Stata是如何组织面板数据的。在Stata中,面板数据有两种格式——宽型(wide form)和长型(long form),这两种格式可以很方便地进行相互转换,通常使用的是长型数据。图1展示了这两种格式的数据,你可能不太明白什么意思,但下面我们会通过一个实际的例子来展示这两种数据格式。

1.png

2是一个实际的例子,列示了三家大银行的2007——2015年的部分财务数据,这样的数据安排是长型面板。我习惯在收集整理数据时,按照Stata要求的格式在Excel中先安排好数据格式(按照你的偏好或者安排数据的便捷程度,可以选择长型和宽型)。在此,我们以长型数据示例。


2.png


假设你已经在Excel中组织好数据,个体(id)、时间(year)及其他变量都有了,下一步就是把这些数据导入到Stata中,此处以Stata14为例。启动软件后,顺次点击file>import>excel,依次选择文件路径等选项,确认之后,就可以看到如图3图4的结果。


3.png

4.png


可以看到,汉字是红色标识的,这是“字符型”数据,其他数字是黑色的,是“数值型”数据,数值型数据可以进行数值运算和逻辑运算。如果你发现导入结果中有一列数字是红色的,比如图5中的ld变量。


5.png


这时候你需要检查一下数据了,可能是Excel中的数据格式不对,这种情况下,使用destring命令可以将字符型数据转换为数值型数据, destring.png


但更多情况是原始数据有误,特别是手动输入数据时,更容易出错,检查一下可以发现,原始数据中有一个数多了一个小数点。


6.png


此时,可以点击这个按钮,调整到数据编辑状态,进行修改(修改后还是红色,该怎么办呢???),也可以在Excel中修改原始数据,然后重新导入。


7.png


完成以上的数据输入工作并检查无误之后,下一步可以定义面板数据了,输入如下命令:

xtset id year(这里的个体和时间变量是我自己定义的),显示的结果如下。


8.png


至此,我们就完成了面板数据的导入和定义,拥有了自己的面板数据,接下来就可以尽情“回归”了!(当然不要忘了各种检验)


以上是以长型面板数据为例展示数据导入和定义,那么宽型数据呢???利用reshape命令我们可以得到相应的宽型面板数据(请自行查看该命令的帮助文档!),


9.png


至于结果什么样,请你自己动手操作一下看看结果吧!这里就有一份现成的数据!!

本帖隐藏的内容

工作簿1.xlsx (12.6 KB)

本帖隐藏的内容

lnw.xls (11 KB)


Ps:有的同学可能数据量比较大,特别是手动搜集的数据,十分辛苦,觉得这样操作太慢!!!但我还是建议初学者按这个流程走一遍,在此过程中,你可能会接触到以下命令:sort  drop order  bysort  gen destring  append  ……


注意:遇到问题,请多多使用百度搜索和论坛的搜索功能,基本上你遇到的问题以前也有人遇到,而各路大神已经给出了简洁高效的解决方案!!!


最后,祝大家都能尽快掌握Stata这一科研利器


以上有不当之处,还请各位多多指教。


关键词:Stata 数据导入 面板数据 tata 初学者 初学者 如何

已有 12 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
suf517222 + 2 + 1 + 1 + 1 精彩帖子
wwqqer + 100 + 5 + 5 + 5 精彩帖子
xujingtang + 80 精彩帖子
格傲8 + 5 + 1 + 1 + 1 精彩帖子
竹鱼 + 1 + 1 + 1 精彩帖子
zhanghui0931 + 100 + 20 + 1 + 2 精彩帖子
长远利益7 + 1 + 1 + 1 精彩帖子
haotianqikeke + 1 + 1 + 1 太棒了
丹地翘翘175 + 1 + 1 + 1 精彩帖子
momingqimiao7 + 2 精彩帖子

总评分: 经验 + 380  论坛币 + 27  学术水平 + 21  热心指数 + 22  信用等级 + 18   查看全部评分

本帖被以下文库推荐

stata SPSS
子路侃侃语 发表于 2016-11-29 21:15:48 |显示全部楼层
真心感谢楼主普及知识
回复

使用道具 举报

h2h2 发表于 2016-11-30 09:46:49 |显示全部楼层
谢谢分享
回复

使用道具 举报

小小我不好 学生认证  发表于 2016-11-30 15:56:21 |显示全部楼层
哈哈哈哈哈哈
回复

使用道具 举报

guanquhao 发表于 2017-6-2 21:27:56 |显示全部楼层
请问前辈我在按照您的方法处理面板数据时出现了这样的提示,我没看懂问题出在哪里,您能指点我一下吗?
. xtset id year
repeated time values within panel

追踪数据所以year变量有重复,ID也有重复
回复

使用道具 举报

日新少年 学生认证  发表于 2017-6-3 13:54:46 |显示全部楼层
THANKS A LOT
回复

使用道具 举报

裴瑞岩 发表于 2017-6-13 20:24:05 |显示全部楼层
谢谢喽
回复

使用道具 举报

chen7650521 发表于 2017-6-18 18:01:31 |显示全部楼层
谢谢楼主分享
回复

使用道具 举报

龙龙龙龙龙 发表于 2017-6-19 07:44:11 |显示全部楼层
谢谢楼主
回复

使用道具 举报

Captain-CUI 学生认证  发表于 2017-6-19 08:32:49 |显示全部楼层
guanquhao 发表于 2017-6-2 21:27
请问前辈我在按照您的方法处理面板数据时出现了这样的提示,我没看懂问题出在哪里,您能指点我一下吗?
.  ...
查看一下变量名是否有重复,或者重新导入
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2021-4-17 19:22