更新时间:2023年8月11日
处理软件:Python + Stata16
样本区间:2023
观测值:4930 + 21335
数据说明:本数据为2023年中国上市公司基本信息,包含两个来源:某浪财经包含A股上市公司(剔除已退市)-27个变量+4930家上市公司,某眼查包含A股、H股、新三板和科创板-21个变量+21335家上市公司工商登记信息。本人最终将二者合并,形成了较为完整的A股上市公司基本信息数据集,具体变量详见下文。为方便大家掌握爬虫和数据处理代码,本数据提供整套数据爬虫(python)以及数据处理合并的代码(Stata)。其实Stata也可以爬虫,以往我都是用Stata,但是Python的爬虫确实更简单、更好用,所以这次是用Pthon爬取的,顺便大家可以学习一些requests、lxml等python库的使用方法。附件采取百度网盘链接形式,任何问题欢迎留言评论和私信,感谢大家支持!
附件包含内容:三个文件夹
1.某浪财经爬虫代码+数据
2.某眼查数据合并代码+数据
3.合并上市数据代码+最终合并数据
包含变量说明:
序号 | 变量 |
1 | 股票代码_str |
2 | 股票代码_str |
3 | 股票简称 |
4 | 公司名称 |
5 | 公司英文名称 |
6 | 上市市场 |
7 | 上市日期 |
8 | 发行价格 |
9 | 主承销商 |
10 | 成立日期 |
11 | 注册资本 |
12 | 机构类型 |
13 | 组织形式 |
14 | 董事会秘书 |
15 | 公司电话 |
16 | 董秘电话 |
17 | 公司传真 |
18 | 董秘传真 |
19 | 公司电子邮箱 |
20 | 董秘电子邮箱 |
21 | 公司网址 |
22 | 邮政编码 |
23 | 信息披露网址 |
24 | 证券简称更名历史 |
25 | 注册地址 |
26 | 办公地址 |
27 | 公司简介 |
28 | 主营业务 |
29 | 经营状态 |
30 | 法定代表人 |
31 | 注册资本 |
32 | 实缴资本 |
33 | 成立日期 |
34 | 核准日期 |
35 | 营业期限 |
36 | 所属省份 |
37 | 所属城市 |
38 | 所属区县 |
39 | 统一社会信用代码 |
40 | 纳税人识别号 |
41 | 注册号 |
42 | 组织机构代码 |
43 | 参保人数 |
44 | 公司类型 |
45 | 所属行业 |
46 | 曾用名 |
47 | 注册地址 |
48 | 最新年报地址 |
49 | 网址 |
50 | 电话 |
51 | 其他电话 |
52 | 邮箱 |
53 | 其他邮箱 |
54 | 经营范围 |
数据代码展示: