stata格式工业企业数据库处理-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 考研考博>>

考研

>>

stata格式工业企业数据库处理

stata格式工业企业数据库处理

发布:j610f2012 | 分类:考研

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

本文转自经管联盟公众号!我们拿到的很多数据源是非标准化的,字段名称不统一、字段结构不统一,等等。在进行数据分析前都要对数据进行标准化处理,以达到理想的数据状态,如工业企业数据库。工业企业数据库的原始格 ...
免费学术公开课,扫码加入


本文转自 经管联盟 公众号!

我们拿到的很多数据源是非标准化的,字段名称不统一、字段结构不统一,等等。在进行数据分析前都要对数据进行标准化处理,以达到理想的数据状态,如工业企业数据库。

工业企业数据库的原始格式是mdb格式,即access数据库格式。由于该数据库每年样本量有几十万条,通过Excel来进行数据处理比较困难。另外,2003版Excel最大行数是65536行 ;2007版本最大行数是1048576行,无法存储大量数据,更不要说进行数据处理了。

工业企业数据库数据处理资料分享链接:

链接:

https://pan.baidu.com/s/1t78Cx3jdton91Ph1OBDqXg

提取码:cxdp

对工业企业数据库的处理:

1、将工业企业数据库里面的表导出成txt格式

2、用insheet命令导入到stata里面

  1. local varname ///id ///co_name ///p_name ///……
  2. insheet `varname' using 2007年中国工业企业数据库.txt,clear
复制代码

注:stata的变量名不能用中文,所有要预先制作一个变量英文映射表

3、对英文变量加上label

这里介绍Excel的两个公式

一个是vlookup,VLOOKUP函数是Excel中的一个纵向查找函数。由于各年公布的工业企业变量名称不完全一致。如工业中间投入这个指标,2006年公布的名称为中间投入合计,2007年公布的名称为工业中间投入合计。所有为了统一各年的名称,可以做一个名称标准表,然后通过vlookup公式查找对应的标准名称,这样对各年变量加label就会是统一的名称了。

另外一个公式是CONCATENATE,CONCATENATE 函数可将最多 255 个文本字符串合并为一个文本字符串。联接项可以是文本、数字、单元格引用或这些项的组合。工业企业数据库中总共有100多个字段,如果写100多个label var 会很麻烦。我们可以在Excel里面写一个label var 的公式,然后通过Excel往下拉,就能实现100多个label var 了,比写循环简单、实用。

4、各年数据合并,数据格式统一

由于数据统计不规范,转换后的数据格式不一定完全统一,如统一变量,有的年份是字符格式,有的年份是数字格式,这就需要统一化处理。

字符转数字,如:

  1. gen pro_code=real(substr(adminarea_code,1,2))
  2. destring(opening_year),gen(opening_year1) force
复制代码

数字转字符,如:

  1. tostring varlist , {generate(newvarlist)|replace} [tostring_options]
复制代码

5、格式统一后,然后选择需要的变量进行合并处理

  1. use qy1999.dta,clearappend using qy2000.dta
复制代码
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-7135248-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。