黃河泉 发表于 2018-3-14 07:36 
1. 資料沒有代表性,兩邊沒有共同的省分?2. 什麼叫做"把第二份数据中所有公司的地级市属性都归到第一份数据 ...
1.不好意思,我的确没有经验,把两个文件sort了一下province,重新dataex了一下,您看这样行不行。
第一个数据集样本:
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input str10 date str16 province str54 issuer
- "09/13/2012" "安徽省" "安徽省交通投资集团有限责任公司"
- "08/25/2010" "安徽省" "芜湖经济技术开发区建设投资公司"
- "08/27/2007" "安徽省" "芜湖市建设投资有限公司"
- "08/01/2012" "安徽省" "淮南矿业(集团)有限责任公司"
- "04/07/2009" "安徽省" "滁州市交通基础设施开发建设有限公司"
- "09/13/2012" "安徽省" "安徽省交通投资集团有限责任公司"
- "06/28/2011" "安徽省" "安徽省皖北煤电集团有限责任公司"
- "03/10/2009" "安徽省" "安徽省能源集团有限公司"
- "11/15/2012" "安徽省" "安徽省合肥市中小企业"
- "01/28/2010" "安徽省" "安徽海螺集团有限责任公司"
- end
复制代码第二个数据集样本:
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input str76 issuer str16 province str22 city
- "合肥市建设投资控股(集团)有限公司" "安徽省" "合肥市"
- "合肥市包河城市建设投资有限公司" "安徽省" "合肥市"
- "巢湖城市建设投资有限公司" "安徽省" "合肥市"
- "安徽省交通投资集团有限责任公司" "安徽省" "合肥市"
- "安徽省港航建设投资集团有限公司" "安徽省" "合肥市"
- "合肥市土地储备中心" "安徽省" "合肥市"
- "合肥市工业投资控股有限公司" "安徽省" "合肥市"
- "肥西县国有资产运营有限公司" "安徽省" "合肥市"
- "安徽省公路管理局" "安徽省" "合肥市"
- "合肥高新城创建设投资有限公司" "安徽省" "合肥市"
- "合肥市国正资产经营有限公司" "安徽省" "合肥市"
- end
复制代码2.所谓“把第二份数据中所有公司的地级市属性都归到第一份数据里面”,就是第一份数据现在有date, issuer, province, amount,第二份数据里有issuer, province, city。因为我的分析单位是地级市,所以要把第二份里面的city整合到第一份数据里面,让第一份数据变成date, issuer, province, amount, city。
顺便说一句,我的最终目的是,date, province, city, amount。因为研究的分析单位就是city。万德上面只能按照债券代码和issuer为单位导出数据。
不知道这样说明是否清楚……