楼主: yangzisheng
56 0

[经管数据集] 2001-2024年上市公司研发费用加计扣除政策效应双重差分 [推广有奖]

  • 0关注
  • 5粉丝

已卖:135份资源

博士生

83%

还不是VIP/贵宾

-

威望
0
论坛币
25 个
通用积分
6.6747
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2022 点
帖子
109
精华
0
在线时间
468 小时
注册时间
2022-4-27
最后登录
2025-10-31

楼主
yangzisheng 在职认证  发表于 昨天 12:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、数据集概述
本数据集用于评估研发费用加计扣除政策对中国A股上市公司的影响效应,
采用双重差分(Difference-in-Differences, DID)方法构建。数据集涵盖
2001年至2024年期间的全部A股上市公司样本,共包含62,624条观测值。

二、政策背景与研究设计
2.1 政策实施时点
        本研究以2016年作为政策冲击的时间节点,评估研发费用加计扣除
        政策的实施效果。
2.2 处理组与对照组划分
        处理组(Treat=1):2016年以前被认定为高新技术企业的上市公司
        对照组(Treat=0):2016年以前未被认定为高新技术企业的上市公司
2.3 时间虚拟变量设定
        政策前时期(Post=0):2016年之前
        政策后时期(Post=1):2016年及之后
2.4 双重差分交互项
        DID = Treat × Post
        该交互项用于识别政策的净效应,即处理组在政策实施前后的变化
        与对照组在政策实施前后变化的差异。

三、数据来源与统计口径
3.1 数据来源
        本数据集的原始数据整理自相关政策文件和上市公司公开披露信息。
3.2 统计口径
        全部中国A股上市公司(沪深两市)
3.3 样本规模
        总观测值数量:62,624条
        详细的描述性统计信息请参见数据集中的统计结果文件。
四、数据文件清单
本数据集包含以下文件:
4.1 基础数据文件
        (1) 公司基本信息.dta
            包含所有上市公司的基础数据和财务指标
            文件格式:Stata数据文件(.dta)
        (2) 高新技术企业.dta
            包含被认定为高新技术企业的上市公司名单
            文件格式:Stata数据文件(.dta)
4.2 分析结果数据文件
        (1) 最终结果_上市公司_未剔除金融STPT.dta
            包含所有上市公司的完整样本(未剔除金融、ST、PT公司)
            文件格式:Stata数据文件(.dta)
        (2) 最终结果_上市公司_未剔除金融STPT.xlsx
            与上述文件内容相同,Excel格式便于数据查看
            文件格式:Excel工作簿(.xlsx)
        (3) 最终结果_上市公司_已剔除金融.dta
            剔除金融行业上市公司后的样本
            文件格式:Stata数据文件(.dta)
        (4) 最终结果_上市公司_已剔除金融.xlsx
            与上述文件内容相同,Excel格式便于数据查看
            文件格式:Excel工作簿(.xlsx)
4.3 程序代码文件
        【代码】.do
            Stata执行代码文件,包含完整的数据处理流程和详细注释
            文件格式:Stata Do文件(.do)
4.4 文档说明文件
        数据说明文档.txt
            本文档,提供数据集的详细说明
            文件格式:文本文件(.txt)
五、文件使用说明
5.1 Stata数据文件(.dta)使用方法
        适用软件:Stata统计软件(建议版本14.0及以上)
        使用方法:
        (1) 启动Stata软件
        (2) 设置工作目录:cd "文件所在路径"
        (3) 加载数据:use 文件名, clear
        (4) 进行数据分析
5.2 Excel数据文件(.xlsx)使用方法
        适用软件:Microsoft Excel 2010及以上版本、WPS表格等
        使用方法:
        (1) 直接双击文件即可打开
        (2) 可进行数据查看、筛选、初步探索等操作
5.3 Stata代码文件(.do)使用方法
        使用方法:
        (1) 在Stata中打开Do文件编辑器
        (2) 打开【代码】.do文件
        (3) 根据需要修改工作目录路径
        (4) 执行代码文件

六、核心变量定义
6.1 处理组虚拟变量(treat)
        变量名称:treat
        变量类型:数值型虚拟变量
        取值说明:
            1 = 高新技术上市公司(处理组,享受政策)
            0 = 非高新技术上市公司(对照组,不享受政策)
6.2 政策时间虚拟变量(post)
        变量名称:post
        变量类型:数值型虚拟变量
        取值说明:
            1 = 2016年及之后(政策实施后)
            0 = 2016年之前(政策实施前)
6.3 双重差分交互项(did)
        变量名称:did
        变量类型:数值型虚拟变量
        计算公式:did = treat × post
        取值说明:
            1 = 处理组在政策实施后的观测值(受政策影响)
            0 = 其他所有情况(不受政策影响或不完全受影响)
        经济含义:该变量的回归系数即为政策的平均处理效应(ATT)
七、数据特点与应用建议
7.1 数据特点
        (1) 时间跨度长:覆盖2001-2024年,共24年数据
        (2) 样本完整:包含全部A股上市公司
        (3) 变量规范:严格按照学术研究标准构建DID变量
        (4) 格式多样:同时提供Stata和Excel两种格式
        (5) 样本多版本:提供未剔除和已剔除金融行业两个版本
7.2 应用建议
        (1) 主回归分析:建议使用"已剔除金融"版本进行主回归,因为
            金融行业的会计准则和经营模式与实体企业存在显著差异。
        (2) 稳健性检验:使用"未剔除金融STPT"版本进行稳健性检验,
            验证研究结论的可靠性。
        (3) 平行趋势检验:在进行DID分析前,务必进行平行趋势检验,
            确认处理组和对照组在政策实施前具有相似的发展趋势。
        (4) 控制变量:建议在回归分析中加入企业规模、财务杠杆、
            盈利能力、成长性等控制变量,以及年度固定效应和
            行业固定效应。
八、实证模型建议
8.1 基准回归模型
        Y_it = α + β₁DID_it + β₂Treat_i + β₃Post_t + ΣγX_it + ε_it
        其中:
        Y_it     = 被解释变量(如企业绩效、创新投入等)
        DID_it   = 双重差分交互项
        Treat_i  = 处理组虚拟变量
        Post_t   = 政策时间虚拟变量
        X_it     = 控制变量集合
        ε_it     = 随机扰动项
        β₁       = 政策效应的估计系数(核心关注参数)
8.2 Stata代码示例
        reghdfe Y did treat post 控制变量, ///
            absorb(year industry) vce(cluster firm)
        说明:
        - reghdfe为高维固定效应回归命令(需安装)
        - absorb()设定年度和行业固定效应
        - vce(cluster firm)设定企业层面的聚类稳健标准误
九、参考文献
本数据集的构建方法和应用参考以下学术文献:
[1] 王玺, 刘萌. 研发费用加计扣除政策对企业绩效的影响研究——基于
        我国上市公司的实证分析[J]. 财政研究, 2020, (11): 101-115.
十、注意事项
10.1 数据使用规范
        (1) 数据处理过程已经过严格审核,但仍建议使用者在分析前
            进行必要的数据清理和异常值检查。
10.2 技术支持
        如在使用过程中遇到问题,可通过以下方式获取帮助:
        (1) 仔细阅读【代码】.do文件中的详细注释
        (2) 参考本说明文档中的使用指南
        (3) 联系数据提供方进行咨询
10.3 数据更新
        本数据集更新时间:2025年10月
        数据时间范围:2001-2024年
        如需最新年度数据,请关注后续更新版本。
十一、技术信息
11.1 文件大小
        数据集总大小:29.03 MB
11.2 软件环境要求
        Stata软件:建议版本14.0或以上
        Excel软件:建议Excel 2010或以上、WPS表格等
        操作系统:Windows 7及以上、macOS、Linux均可
11.3 推荐Stata命令包
        (1) reghdfe:高维固定效应回归
        (2) estout:回归结果输出
        (3) winsor2:极值处理
        (4) logout:描述性统计输出
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司 双重差分 研发费用 上市公 differences

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-17 18:30