楼主: Captain-CUI
170017 219

[学习心得] 初学者如何把面板数据导入到Stata中     [推广有奖]

学术权威

84%

还不是VIP/贵宾

-

TA的文库  其他...

Stata小问题

Shibor

威望
6
论坛币
551196 个
通用积分
26049.6965
学术水平
2623 点
热心指数
2893 点
信用等级
2428 点
经验
343140 点
帖子
5792
精华
19
在线时间
2308 小时
注册时间
2014-10-6
最后登录
2023-11-28

初级学术勋章 中级热心勋章 初级热心勋章 中级学术勋章 高级学术勋章 高级热心勋章 初级信用勋章 中级信用勋章 特级热心勋章 高级信用勋章 特级学术勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

对于Stata初学者而言,把面板数据顺利的导入到Stata中,过程是比较“艰辛”的!但是如果你能够迈过这个坎,那么你的Stata实际操作将有一个显著的提升,对于Stata的数据格式也会有更深的理解。要想把数据输入到Stata中,你首先要知道Stata是如何组织面板数据的。在Stata中,面板数据有两种格式——宽型(wide form)和长型(long form),这两种格式可以很方便地进行相互转换,通常使用的是长型数据。图1展示了这两种格式的数据,你可能不太明白什么意思,但下面我们会通过一个实际的例子来展示这两种数据格式。

1.png

2是一个实际的例子,列示了三家大银行的2007——2015年的部分财务数据,这样的数据安排是长型面板。我习惯在收集整理数据时,按照Stata要求的格式在Excel中先安排好数据格式(按照你的偏好或者安排数据的便捷程度,可以选择长型和宽型)。在此,我们以长型数据示例。


2.png


假设你已经在Excel中组织好数据,个体(id)、时间(year)及其他变量都有了,下一步就是把这些数据导入到Stata中,此处以Stata14为例。启动软件后,顺次点击file>import>excel,依次选择文件路径等选项,确认之后,就可以看到如图3图4的结果。


3.png

4.png


可以看到,汉字是红色标识的,这是“字符型”数据,其他数字是黑色的,是“数值型”数据,数值型数据可以进行数值运算和逻辑运算。如果你发现导入结果中有一列数字是红色的,比如图5中的ld变量。


5.png


这时候你需要检查一下数据了,可能是Excel中的数据格式不对,这种情况下,使用destring命令可以将字符型数据转换为数值型数据, destring.png


但更多情况是原始数据有误,特别是手动输入数据时,更容易出错,检查一下可以发现,原始数据中有一个数多了一个小数点。


6.png


此时,可以点击这个按钮,调整到数据编辑状态,进行修改(修改后还是红色,该怎么办呢???),也可以在Excel中修改原始数据,然后重新导入。


7.png


完成以上的数据输入工作并检查无误之后,下一步可以定义面板数据了,输入如下命令:

xtset id year(这里的个体和时间变量是我自己定义的),显示的结果如下。


8.png


至此,我们就完成了面板数据的导入和定义,拥有了自己的面板数据,接下来就可以尽情“回归”了!(当然不要忘了各种检验)


以上是以长型面板数据为例展示数据导入和定义,那么宽型数据呢???利用reshape命令我们可以得到相应的宽型面板数据(请自行查看该命令的帮助文档!),


9.png


至于结果什么样,请你自己动手操作一下看看结果吧!这里就有一份现成的数据!!

本帖隐藏的内容

工作簿1.xlsx (12.6 KB)

本帖隐藏的内容

lnw.xls (11 KB)


Ps:有的同学可能数据量比较大,特别是手动搜集的数据,十分辛苦,觉得这样操作太慢!!!但我还是建议初学者按这个流程走一遍,在此过程中,你可能会接触到以下命令:sort  drop order  bysort  gen destring  append  ……


注意:遇到问题,请多多使用百度搜索和论坛的搜索功能,基本上你遇到的问题以前也有人遇到,而各路大神已经给出了简洁高效的解决方案!!!


最后,祝大家都能尽快掌握Stata这一科研利器


以上有不当之处,还请各位多多指教。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数据导入 面板数据 tata 初学者 初学者 如何

已有 17 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
cxh啊 + 1 + 1 + 1 精彩帖子
Zhln1007 + 1 + 1 + 1 精彩帖子
那年,那月… + 5 + 5 + 5 精彩帖子
zl89 + 80 精彩帖子
np84 + 100 精彩帖子
suf517222 + 2 + 1 + 1 + 1 精彩帖子
wwqqer + 100 + 5 + 5 + 5 精彩帖子
xujingtang + 80 精彩帖子
格傲8 + 5 + 1 + 1 + 1 精彩帖子
竹鱼 + 1 精彩帖子

总评分: 经验 + 560  论坛币 + 27  学术水平 + 28  热心指数 + 29  信用等级 + 25   查看全部评分

本帖被以下文库推荐

沙发
子路侃侃语 发表于 2016-11-29 21:15:48 |只看作者 |坛友微信交流群
真心感谢楼主普及知识

使用道具

藤椅
h2h2 发表于 2016-11-30 09:46:49 |只看作者 |坛友微信交流群
谢谢分享

使用道具

板凳
小小我不好 学生认证  发表于 2016-11-30 15:56:21 |只看作者 |坛友微信交流群
哈哈哈哈哈哈

使用道具

报纸
guanquhao 发表于 2017-6-2 21:27:56 |只看作者 |坛友微信交流群
请问前辈我在按照您的方法处理面板数据时出现了这样的提示,我没看懂问题出在哪里,您能指点我一下吗?
. xtset id year
repeated time values within panel

追踪数据所以year变量有重复,ID也有重复

使用道具

地板
日新少年 学生认证  发表于 2017-6-3 13:54:46 |只看作者 |坛友微信交流群
THANKS A LOT

使用道具

7
裴瑞岩 发表于 2017-6-13 20:24:05 |只看作者 |坛友微信交流群
谢谢喽

使用道具

8
chen7650521 发表于 2017-6-18 18:01:31 |只看作者 |坛友微信交流群
谢谢楼主分享

使用道具

9
龙龙龙龙龙 发表于 2017-6-19 07:44:11 |只看作者 |坛友微信交流群
谢谢楼主

使用道具

10
Captain-CUI 学生认证  发表于 2017-6-19 08:32:49 |只看作者 |坛友微信交流群
guanquhao 发表于 2017-6-2 21:27
请问前辈我在按照您的方法处理面板数据时出现了这样的提示,我没看懂问题出在哪里,您能指点我一下吗?
.  ...
查看一下变量名是否有重复,或者重新导入

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 20:18