楼主: fionababy_23
1503 10

[学习心得] DMD课程STATA学习知识点整理 [推广有奖]

  • 0关注
  • 0粉丝

初中生

19%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
23.4875
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
140 点
帖子
13
精华
0
在线时间
6 小时
注册时间
2023-12-24
最后登录
2024-1-13

楼主
fionababy_23 发表于 2023-12-24 11:51:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据和编程小白一枚,整理了一些STATA做数据分析的一些基本学习资料,仅供参考,不定期更新。

STATA数据分析实操的一些示例解释 - Duanduan的文章 - 知乎
https://zhuanlan.zhihu.com/p/673877900

如何用stata做正态性检验报告 - Duanduan的文章 - 知乎
https://zhuanlan.zhihu.com/p/673871998

STATA里线性回归里的各项数据代表什么? - Duanduan的回答 - 知乎
https://www.zhihu.com/question/636312482/answer/3336482678







二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:stata学习 知识点整理 Stata tata DMD

沙发
newfei188 发表于 2023-12-24 12:14:27

藤椅
这里的黎明 发表于 2023-12-24 12:26:31

板凳
fionababy_23 发表于 2024-1-6 19:12:48

拿到数据后,开始分析前需要做的一些前期准备和数据清洗工作
/*清空存储和前期设置*/
clear all
set more off
cap log use
sysdir set PLUS "/Users/xxx" /*设置结果保存路径*/


/*导入数据*/
import excel "/Users/data.xlsx", sheet("Sheet1") firstrow

/*将第一行的内容设置为标签*/
labone, nrow(1)

/*初步数据清洗*/
drop in 1  /*删除第一行,行=varlist,列=observation*/
destring varname-vaname,replace /*去字符化,replace是替换原列,generate()可以新建一列并重命名*/
missings dropvars, force /*删除所有值为是缺失值的变量(删除空列)*/
missings dropobs, force /*missings dropobs(删除整行都没有数值的空行)*/


如果程序里没有missings命令,需要使用ssc install命令进行安装

报纸
fionababy_23 发表于 2024-1-6 19:32:19
fionababy_23 发表于 2024-1-6 19:12
拿到数据后,开始分析前需要做的一些前期准备和数据清洗工作
/*清空存储和前期设置*/
clear all
/*生成标题和引言*/
qui{
/*建立一个word文件,并从STATA输出论文标题*/
putdocx begin
putdocx paragraph, style(Title)
putdocx text ("论文标题文字"), font("宋体",, black)
putdocx save Thesis.docx , replace

/*在word文件中,输入第一章标题*/
putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题1*/
putdocx text ("一、引言"), font("宋体",, black)
putdocx save 想要存储的文件名,下面就用A来代替.docx , append

/*在word文件中,输入引言内容*/
putdocx begin
putdocx paragraph
putdocx text ("引言内容"), font("宋体",10.5)
putdocx save A.docx , append

}

地板
fionababy_23 发表于 2024-1-6 20:36:34
做量化分析的一些思路:
首先,先对数据进行描述性统计计算,展示对被解释变量、解释变量以及控制变量的描述性统计分析,常用的命令是
/*描述性统计计算*/       
sum 变量名称, detail


/*更高阶的做表方式*/
table (command) (result), ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量1, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量2, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量3, detail) ///

nformat(%10.2g) sformat(%7s) /*计算描述性统计的结果*/
/*以此类推,有几个想要展示的变量就重复几次*/

/*输出描述性统计结果表*/
putdocx paragraph
collect style putdocx, layout(autofitcontents) title("表1.XXXX情况描述性统计表") indent(8 pt)
return list
collect label list command, all  /*列出每一行的内容并报告行号*/
collect label levels command 1 "变量1的标签", modify
collect label levels command 2 "变量2的标签", modify
collect label levels command 3 "变量3的标签", modify
collect preview
putdocx collect /*将表格插入到word文档中*/



/*生成对描述性统计的文字说明*/
putdocx paragraph
putdocx text ("表1给出了对被解释变量、解释变量以及控制变量的描述性统计分析结果。"), font("宋体",10.5)
putdocx save A.docx , append



接下来,进入实证分析的部分
/*实证分析*/
gen inter= 解释变量1*调节变量2 /*通过解释变量1与调节变量2相乘,生成交乘项inter*/
reg 被解释变量 解释变量1 inter 解释变量2
predict e, residual


putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题1*/
putdocx text ("三、实证分析"), font("宋体",, black)


在报告计量结果之前,首先需要检验数据变量是否满足最小二乘法的基本假定,这些假定包括线性性、正态性、独立性和同方差性。可以通过以下几种图形检验的方法进行。
1. 残差分布分位正态图
检验回归误差项e偏离参考线的程度,具体命令为
/*正态性检验*/
/*分位正态*/
putdocx paragraph
quantile e, graphregion(fcolor(white) lcolor(white)) b1("图1. 残差分布分位正态图") xsize(8) ysize(6) scale(1.4)
graph export qua.png , replace
putdocx image qua.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("由图1可以看出,回归误差项e在均值点前半部分高于参考线,在均值点后半部分低于参考线,这表明回归误差项基本满足对称性,但在均值两侧的分布相比正态分布的数据更加集中,与正态分布存在一定差异。"), font("宋体",10.5)

2. 残差分布直方图(附参考线)
检验残差项e偏离正态分布的情况,具体命令为
/*正态拟合*/
putdocx paragraph
hist e, bin(7) percent normal graphregion(fcolor(white) lcolor(white)) b1("图2.残差分布直方图(附参考线)") fcolor(dknavy) lc(black) xsize(8) ysize(6) scale(1.4)
graph export hist.png , replace
putdocx image hist.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("图2的结论与图1结论类似。由图2可以明显看出,相较于正态分布,回归误差项在靠近均值附近的分布集中趋势更高,表现出有别于正态分布的形态,但是偏离程度不大。"), font("宋体",10.5)


3. 残差散点图
检验残差项e在随着X的变化是否没有明显变化规律,具体命令为
/*线性性与同方差性检验*/
putdocx paragraph
scatter e Dep01, graphregion(fcolor(white) lcolor(white)) yline(0) b1("图3.残差散点图(附参考线)")
graph export escatt.png , replace
putdocx image escatt.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("由图3可以看出,回归误差项较为均匀的分布在X轴两侧,且没有明显的证据表明随机误差项的均值随着X的变化而有规律的而变化,因此原模型满足线性性假定和独立性假定。但是,随着X的增加,回归误差项e的离散程度有轻微扩大的趋势,因此在最终模型当中,应当对方差进行修正,以避免异方差问题对显著性的影响"), font("宋体",10.5)


putdocx save A.docx, append



7
fionababy_23 发表于 2024-1-6 20:51:11
fionababy_23 发表于 2024-1-6 20:36
做量化分析的一些思路:
首先,先对数据进行描述性统计计算,展示对被解释变量、解释变量以及控制变量的描 ...
接上文 做量化分析的一些思路下面进入计量结果的展示和分析说明

/*计量结果与分析*/
putdocx begin
putdocx paragraph, style(Heading2) /*设置格式为word标题2*/
putdocx text ("2.计量结果与分析"), font("宋体",, black)
putdocx save A.docx, append


reg 被解释变量 解释变量1 交乘项 解释变量2
outreg2 * using A.doc, replace stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3 解释变量4, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3 解释变量4 解释变量5, r
outreg2 * using A.doc, stats(coef se)

preserve
import delimited "/Users/Desktop/具体路径/A.txt", clear
putdocx begin
putdocx table A = data(v1 v2 v3 v4 v5 v6), title("表2. 解释变量对被解释变量的影响")
putdocx table A(.,.), font("Times New Roman",10.5)
putdocx save A.docx, append
restore


/*分析文字说明*/
putdocx begin
putdocx paragraph
putdocx text ("表2第2行计量结果显示,解释变量1的系数显著为正,这表明解释变量1增加会相应增加被解释变量解释变量1对于被解释变量有着显著的正向影响,在不控制解释变量2解释变量3以及解释变量4的情况下,这种影响仅略小于解释变量5的影响。此外,交乘项inter的系数也显著为正。表明调节变量进一步放大了解释变量1被解释变量的影响。通过上述计量结果可以得出结论,XXXXXXX。"), font("宋体",, black)
putdocx save A.docx, append


最后不要忘记了最后的结论哦~
/*结论*/
putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题2*/
putdocx text ("四、结论"), font("宋体",, black)
putdocx paragraph
putdocx text ("本文探讨了解释变量们被解释变量的刚性影响,计量结果证实这一影响机制,同时还发现了调节变量对这种机制的证相同调节作用。本文的研究为进一步探讨地方XXXX问题提供了新的视角。本文的主要不足在于,没有考虑可能的反向因果问题带来的内生性影响。期待后续的研究可以改进这一问题。"), font("宋体",10.5)


putdocx save A.docx, append


putdocx clear


有的版本的可能存在保存的word文档不在目标储存文件夹的情况,用查找功能找到对应名字的文件就好啦

8
fionababy_23 发表于 2024-1-6 21:15:49
fionababy_23 发表于 2024-1-6 20:36
做量化分析的一些思路:
首先,先对数据进行描述性统计计算,展示对被解释变量、解释变量以及控制变量的描 ...
下一步就是展示计量结果并对结果进行分析说明

/*计量结果与分析*/
putdocx begin
putdocx paragraph, style(Heading2) /*设置格式为word标题2*/
putdocx text ("2.计量结果与分析"), font("宋体",, black)
putdocx save A.docx, append

reg 被解释变量 解释变量1 交乘项 解释变量2
outreg2 * using A.doc, replace stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3 解释变量4, r
outreg2 * using A.doc, stats(coef se)
reg 被解释变量 解释变量1 交乘项 解释变量2 解释变量3 解释变量4 解释变量5, r
outreg2 * using A.doc, stats(coef se)

preserve
import delimited "/存储路径/A.txt", clear
putdocx begin
putdocx table A = data(v1 v2 v3 v4 v5 v6), title("表2. 解释变量对被解释变量的影响")
putdocx table A(.,.), font("Times New Roman",10.5)
putdocx save A.docx, append
restore

/*分析说明文字*/
putdocx begin
putdocx paragraph
putdocx text ("表2第2行计量结果显示,解释变量1的系数显著为正,这表明解释变量1增加会相应增加被解释变量解释变量1对于被解释变量有着显著的正向影响,在不控制解释变量2解释变量3以及解释变量4的情况下,这种影响仅略小于解释变量5的影响。此外,交乘项inter的系数也显著为正。表明调节变量进一步放大了解释变量1被解释变量的影响。通过上述计量结果可以得出结论,XXXXXX。"), font("宋体",, black)
putdocx save A.docx, append

最后,不要忘了陈述最终的结论


/*结论*/
putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题2*/
putdocx text ("四、结论"), font("宋体",, black)
putdocx paragraph
putdocx text ("本文探讨了解释变量被解释变量的刚性影响,计量结果证实这一影响机制,同时还发现了调节变量对这种机制的证相同调节作用。本文的研究为进一步探讨XXX问题提供了新的视角。本文的主要不足在于,没有考虑可能的反向因果问题带来的内生性影响。期待后续的研究可以改进这一问题。"), font("宋体",10.5)


putdocx save A.docx, append


putdocx clear


某些版本的STATA存在word文档在目标储存文件夹找不到的情况,可以用查找的方式,搜索文件名找到文档


9
Jocelynjo 发表于 2024-1-10 13:38:58
Chapter 3 数据描述度量
Chapter 4 概率论基础

DMD 数据描述度量+概率论基础.png (1.64 MB)

DMD 数据描述度量+概率论基础.png

10
dklhkj 发表于 2024-1-12 02:13:39
线性回归方程

截屏2024-01-12 02.12.18.png (261.72 KB)

截屏2024-01-12 02.12.18.png

截屏2024-01-12 22.25.00.png (314.41 KB)

截屏2024-01-12 22.25.00.png

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-4 07:01