楼主: zhaozimeng
181209 837

[经管数据集] 【更新至2020】1990-2020年中国上市公司数据(最全!数据+代码)   [推广有奖]

139
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-14 09:12:03 来自手机
coolnan123 发表于 2020-10-12 20:49
所在城市,是地级市层面吗?
是的,所在省市及行政区划代码均有,而且区分了注册地和办公地。

138
ljd0573741(真实交易用户) 发表于 2020-10-13 15:40:26
请教楼主:刚处理数据又有个疑问了,按照证监会的上市公司行业分类代码,I代表金融保险业,而J代表F代表房地产业,楼主的数据中Nindcd变量里的I01是银行业,Nnindcd中的J66又是货币金融服务业,我现在想要剔除掉金融服务业改用那个变量进行筛选呢?

137
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-13 11:32:01 来自手机
coolnan123 发表于 2020-10-12 20:40
已经买了,我只想要沪深两市的A股数据怎么办? Q  540561540
用ABSigh变量就可以,具体可以参考一下本帖第132-134楼的评论~注意私信信息哈

136
coolnan123(真实交易用户) 发表于 2020-10-12 20:49:45
所在城市,是地级市层面吗?

135
coolnan123(真实交易用户) 发表于 2020-10-12 20:40:36
已经买了,我只想要沪深两市的A股数据怎么办? Q  540561540

134
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-12 11:22:09 来自手机
zhaozimeng 发表于 2020-8-4 10:37
更新!终于整理完了!本数据为1990-2019年的上市公司数据,数据更新时间为2020年7月(最新噢!)。在上一版 ...
感谢“蜉蝣天地”的提问(一共四个问题),有一些共性问题,我这里统一回复下:<br>
【问题1】:关于ST公司。是删除该公司ST年份(某几个年份)的数据,还是把这个公司所有年份的观测值都删除?<br>
【回答】:本数据中提供了IsSTx(是否*ST)、IsST(是否ST)、IsPT(是否PT)三个虚拟变量,可通过这三个变量进行筛选,剔除这些公司。最精确的方法肯定是仅仅剔除对应的公司和对应的年份,但是把对应公司全部年份的观测值均剔除也是正常的筛选方法,很多公司金融的研究也是这样处理的,对实证结果的影响不会很大,通过这个三个变量剔除就可以了。<br>
【问题2】:我看你个人主页还是其他数据库,请问与这个与区别吗?是否有其他变量不包括这个149元的数据库里?<br>
【回答】:本上市公司的数据是非常全面的(帖子正文中有较详细的说明),包含部分其他的帖子的数据,如股权性质和公司治理、上市公司基本信息数据。当然,很多其他主题也是不包含的,如上市公司社会责任及其明细、盈余管理、上市公司人物特征等,可根据需要进行选择。<br>
【问题3】:楼主一般什么时候更新呢?请问下一次还会更新吗?如更新,我们这些老客户是否有优惠?<br>
【回答】:数据每年会更新,每年等到上市公司年报公布、数据库更新以后再更新,一般为每年的7月份左右,老客户只需要更新最新年度的数据即可,提供merge完整代码,方便合并。<br>
【问题4】:楼主,刚把数据下载下来。看了下,id是后来生成的。请问,如何生成原有的六位的证券编码?<br>
【回答】:很多人问我这个问题,其实数值型的id更容易进行匹配,使用起来也更方面,推荐大家使用数值型的。同时,很多人想转换成六位代码,其实很简单,可以输入如下代码:tostring id, gen(id_org) format(%06.0f),id_org即为原始的字符串六位代码。

133
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-11 14:54:28
ljd0573741 发表于 2020-10-10 17:55
请问需要A股上市公司的数据,利用ABSign(即AB股标识)进行筛选还是利用Aonly(是否发型A股)进行筛选呢?
...
您好,补充回答您提出的两个问题:
问题1:ABSign变量利用同一id补全缺失值的原理是什么?
回答:ABSign是区分A股还是B股的虚拟变量,1代表A股,2代表B股。在多个数据库merge的过程中,可能会因为不同变量涵盖的年度范围不同导致一定的缺失值。但是对于同一个id(同一家上市公司),不同年份是A股还是B股应当是统一的,也就是说我们可以利用同一id的不同年份补充ABSign的缺失值。例如,假如id为1的公司2019年的ABSign为1(即A股),但2018年的数据为缺失值,那么,我们就可以利用2019年的数据,将2018年的缺失值补充为1(即A股)。我写的foreach循环,就可以批量完成这一工作,确保每家公司每个年度的ABSign统一,填补了缺失值。
问题2:关于行业代码的筛选?
回答:数据集中提供了多个行业的分类标准,可以通过输入“lookfor 行业”命令进行搜索。最为常见的行业分类是2001年版证监会行业分类代码(Nindcd Nindnme)和2012版证监会行业分类代码(Nnindcd Nnindnme),当然,我也根据一些常见的处理方法,生成了一些常用的行业变量(主要是以Sic开头的一些变量),如将制造业细分,其他行业不细分等等。筛选使用的时候可以根据自己的划分方法使用,我个人比较常用的行业划分变量是Sic2,可以参考一下。

132
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-11 09:49:48 来自手机
ljd0573741 发表于 2020-10-10 17:55
请问需要A股上市公司的数据,利用ABSign(即AB股标识)进行筛选还是利用Aonly(是否发型A股)进行筛选呢?
...
您好,使用ABSign变量就可以,具体内容已经私信您~

131
ljd0573741(真实交易用户) 发表于 2020-10-10 17:55:47
请问需要A股上市公司的数据,利用ABSign(即AB股标识)进行筛选还是利用Aonly(是否发型A股)进行筛选呢?

130
zhaozimeng(未真实交易用户) 在职认证  发表于 2020-10-10 09:33:56 来自手机
ljd0573741 发表于 2020-10-8 11:31
请问工资、利润等投入产出数据关于钱的要平减到基年吗
通常而言,从我看到的上市公司层面的研究来看,一般变量都是不需要平减的。但是要注意统一量纲,比如同除以总资产等。比率类指标一般直接用就可以,因为横向可比。薪酬这类变量可以取对数转换成增长率。另外,总量方程和差分方程还是需要斟酌,注意系数的不同解释。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 13:01