请选择 进入手机版 | 继续访问电脑版
按年份索引
按国、省、市索引
综合索引
-->
返回列表
提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心
楼主: jiangbeilu
27694 81

[行业统计年鉴] 工业企业数据库处理一般流程   [推广有奖]

  • 2关注
  • 69粉丝

学科带头人

92%

还不是VIP/贵宾

-

TA的文库  其他...

数据处理

威望
2
论坛币
497158 个
通用积分
12679.4881
学术水平
517 点
热心指数
662 点
信用等级
353 点
经验
147956 点
帖子
2346
精华
1
在线时间
2047 小时
注册时间
2012-11-6
最后登录
2022-8-19

初级热心勋章 中级热心勋章 初级信用勋章 初级学术勋章 中级信用勋章 高级热心勋章

jiangbeilu 学生认证  发表于 2015-10-23 11:15:02 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
中国工业企业数据库十分庞大,处理起来也比较费力。
当前学术界用的一般都是在2006年及以前的数据。
在处理过程中,遇到一些问题,在综合其它文献的基础上,给出本人的处理方式,
希望同用这个数据库的坛友在处理过各中遇到的问题,可以相互讨论。
[size=14.193549156189px]具体流程如下:
[size=14.193549156189px]

1.去除总资产,职工人数,工业总产值,固定资产净值,销售额 缺失值
2.保留实收资本>0企业

3.检查企业类型:国有资本/实收资本=ratio
  ratio>0.5, 国有控股

4. 规模以上企业:国有企业+非国有但销售额过500万
2006年以前,以500万为线,2006后,以2000万为线
备注:一般来说,工业企业数据库的单位是千元,所以这里在做判别时需要以5000为界

5.职工人数小于8,缺乏有效会计系统

6.固定资产、总资产、工业总产值为0,剔除

7.总资产小于流动资产,总资产小于固定资产净值、累计折旧小于当期折旧,这三个不符合会计准则

8.重复企业单独挑出来


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:工业企业数据库 工业企业数 企业数据 工业企业 数据库 数据库 工业

回帖推荐

jiangbeilu 发表于8楼  查看完整内容

我说的流程,是已经拿到数据后,需要实际使用时作的一些处理过程。 原始的数据还是很粗糙的,即便是统计局的数据,谁也不能保证没有统计工作中的错误。 我们做的工作,就是尽可能得把一些很明显的错误给剔除,使得研究的结果在数据上尽可能可靠。 但是因为数据量实在太大,详细核对每一条记录在时间和精力上都不允许,所以需要采取一些通用的准则来对数据进行预处理。
已有 1 人评分论坛币 收起 理由
ivannj + 2 鼓励积极发帖讨论

总评分: 论坛币 + 2   查看全部评分

本帖被以下文库推荐

Tomorrow is another day!
chenhao622 发表于 2015-10-23 11:23:06 |显示全部楼层 |坛友微信交流群
楼主能提供最新的工业企业数据么?

使用道具

xuchengbo 发表于 2015-10-23 11:26:09 |显示全部楼层 |坛友微信交流群
非常感谢!
已有 1 人评分论坛币 收起 理由
jiangbeilu + 2 鼓励积极发帖讨论

总评分: 论坛币 + 2   查看全部评分

使用道具

jiangbeilu 学生认证  发表于 2015-10-23 11:55:55 |显示全部楼层 |坛友微信交流群
chenhao622 发表于 2015-10-23 11:23
楼主能提供最新的工业企业数据么?
你说的最新数据是指?

使用道具

wtc#sofa 在职认证  发表于 2015-10-23 14:54:58 |显示全部楼层 |坛友微信交流群
国家统计局是不是也是这样的?
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 鼓励积极发帖讨论

总评分: 论坛币 + 5   查看全部评分

使用道具

jiangbeilu 学生认证  发表于 2015-10-23 14:57:44 |显示全部楼层 |坛友微信交流群
wtc#sofa 发表于 2015-10-23 14:54
国家统计局是不是也是这样的?
不明白您说的国家统计局的这样是哪样子?可否具体说一下您的问题

使用道具

wtc#sofa 在职认证  发表于 2015-10-23 15:02:24 |显示全部楼层 |坛友微信交流群
jiangbeilu 发表于 2015-10-23 14:57
不明白您说的国家统计局的这样是哪样子?可否具体说一下您的问题
统计局也有用一栏工业企业数据,不知道他的流程和你说的是一样么

使用道具

jiangbeilu 学生认证  发表于 2015-10-23 15:06:51 |显示全部楼层 |坛友微信交流群
我说的流程,是已经拿到数据后,需要实际使用时作的一些处理过程。
原始的数据还是很粗糙的,即便是统计局的数据,谁也不能保证没有统计工作中的错误。
我们做的工作,就是尽可能得把一些很明显的错误给剔除,使得研究的结果在数据上尽可能可靠。
但是因为数据量实在太大,详细核对每一条记录在时间和精力上都不允许,所以需要采取一些通用的准则来对数据进行预处理。

使用道具

西门高 发表于 2015-10-23 16:09:04 |显示全部楼层 |坛友微信交流群
谢谢分享
已有 1 人评分论坛币 收起 理由
jiangbeilu + 2 鼓励积极发帖讨论

总评分: 论坛币 + 2   查看全部评分

使用道具

jiangbeilu 学生认证  发表于 2015-10-24 08:16:39 |显示全部楼层 |坛友微信交流群
我这里04年的数据,只有3万多家企业是不重复名称和企业代码的。应该是有问题的数据。不知道各位有没有遇到这样的问题呢?

使用道具

返回列表
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 06:23