楼主: njustschool
1849 3

[实际应用] 怎样补充缺失的数据,整理成二值结果 [推广有奖]

  • 2关注
  • 0粉丝

本科生

7%

还不是VIP/贵宾

-

威望
0
论坛币
740 个
通用积分
0.0005
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
231 点
帖子
10
精华
0
在线时间
140 小时
注册时间
2008-6-14
最后登录
2023-9-24

楼主
njustschool 发表于 2014-3-29 23:47:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

提问截图.png

各位大侠,在下遇到问题,盼各位不吝赐教。有个我国出口数据库,统计了每个hs编码下,我国出口到了哪些国家及其数量。每个hs编码下,也有国家中国并未出口。我想把每个hs编码下中国出口的目的国家赋值为1,没有出口的国家赋值为0。但是数据库格式只显示有出口的目的国,没有显示未出口的国家。本想自己按照一百多个国家手动添加补齐0值,但是数据库多达几十万条,无法完成。期盼各位出出主意怎样处理为好。多谢了。

表中目的国数字是国家代码。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:HS编码 各位大侠 数据库 中国 国家 数据库 统计

沙发
zj20000101 发表于 2014-3-30 00:05:43
这个问题很好解决啊
调入到stata中,生成一个二值变量 output
gen outport=1 if hs!=""  // 当hs不等于空值时,赋为1
replace   outport=0  if hs==""  

藤椅
njustschool 发表于 2014-3-30 19:19:55
谢谢回复。hs编码是已知的,hs=没有什么作用。例如在hs=280110时,有的国家例如代码为999的国家没有出口,则这个数据库压根不出现一行为 280110, 999, 0(出口额)。我的意思是如何让表格自动补齐这行数据。因为国家数量和hs编码总量都是固定的,似乎应该可以有个命令或者程序来不断循环搜索和赋值。希望得到高手的指点。

板凳
njustschool 发表于 2014-3-30 19:45:27
我设想对每个hs编码进行所有国家配对搜索,这样数据库中能配对出现的就是有出口,赋值为1。配不上对的只有hs编码没出现国家代码的就赋值为0。例如能搜索到表中280110和国家代码8表示对国家8有出口,赋值为1;而不能搜索到280110和国家代码999,则表示对国家999没有出口,赋值为0。这样似乎只要配对搜索就可解决,但是我实在不知道怎样实现,请各位指点。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 06:05