UN Comtrade数据库不同年份的产品编码存在迭代,如HS2002、HS2007、HS2012、HS2017等多个编码版本。本人试图参考李保霞(2023)《竞争国汇率与出口产品质量:兼论人民币汇率的国际影响》利用联合国贸易数据测算国家-产品层面的出口产品质量。
其中李老师文中提到 “产品为HS2002海关协调编码六分位下的细分种类”,我的理解是将其他产品编码版本(HS2007 2012 2017等)匹配到HS2002,官网给出了不同HS版本的对照表 https://unstats.un.org/unsd/classifications/Econ,但是对应关系有1 : 1、n : 1、1 : n和 n : n四种,根据产品质量的测算公式,需要将产品合并为HS2002编码下的产品的信息(数量和价格)。
数据结构大致如下:
reporter|partner|year |value|quality| HS2002|HS2007|relationship_07| HS2012|relationship_12
1 | 2 |2002| ## | ### | ####| ####| 1:1 | ####| 1:1
1 | 2 |2002| ## | ### | ####| ####| 1:1 | ####| 1:1
1 | 2 |2007| ## | ### | ####| ####| 1:n | ####| 1:n
1 | 3 |2007| ## | ### | ####| ####| 1:n | ####| 1:n
1 | 3 |2012| ## | ### | ####| ####| n:1 | ####| n:1
1 | 3 |2012| ## | ### | ####| ####| n:n | ####| n:n