- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input float year str6 exp_imp str8 product_code str75 product_name str20 firm_code double value
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 178481
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 121633
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 348429
- 2013 "进口" "39261000" "塑料制办公室或学校用品" "1101910002" 2088
- 2013 "进口" "48192000" "非瓦楞纸或纸板制的可折叠箱、盒、匣" "1101910002" 324
- end
按照进出口,公司编码,商品种类分别求和
运行代码
- bysort firm_code exp_imp product_code: gen value_sum = sum(value)
结果如下
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input float year str6 exp_imp str8 product_code str75 product_name str20 firm_code double value float value_sum
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 348429 348429
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 178481 526910
- 2013 "出口" "49019900" "其他书籍、小册子及类似印刷品" "1101910002" 121633 648543
- 2013 "进口" "39261000" "塑料制办公室或学校用品" "1101910002" 2088 2088
- 2013 "进口" "48192000" "非瓦楞纸或纸板制的可折叠箱、盒、匣" "1101910002" 324 324
- end
现在2013出口的第一行和第二行的数据已经不需要了(即value_sum为348429和526910的两行数据),我需要剔除掉,请问如何操作?
我有一个想法是,year exp_imp product_code firm_code 相同时 仅保留value_sum最大的一项?不知道有没有相关语句可以实现。
谢谢大家了!!!