楼主: bluce-lee
3430 7

[数据管理求助] 城市名称都是字符型,怎么对其进行编码呢? [推广有奖]

  • 8关注
  • 10粉丝

已卖:6份资源

学科带头人

53%

还不是VIP/贵宾

-

威望
0
论坛币
4282 个
通用积分
725.7253
学术水平
104 点
热心指数
106 点
信用等级
80 点
经验
22937 点
帖子
1538
精华
0
在线时间
3233 小时
注册时间
2014-1-5
最后登录
2026-1-22

楼主
bluce-lee 发表于 2021-11-23 16:41:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币


坛友们,我的个体样本有12万个,个体所在的城市是字符型,如图的红色。转换为数值型后,就是stata自动给的编码,因为我还需要把该城市匹配另一个数据库,需要对每个城市名称进行编码code,比如青岛市就是3702,请问有没有推荐的办法对其进行编码,以进行后续的数据匹配?请各位帮忙
不要建议我手工啊,样本量太多了,有300多个城市级名称



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:字符型 Stata 请各位帮忙 请问有没有 数据匹配

1637656718(1).png (77.73 KB)

1637656718(1).png

1637656718(1).png (77.73 KB)

1637656718(1).png

沙发
bluce-lee 发表于 2021-11-23 21:23:04
已经搞定了。第一步encode转换为数值型,然后通过duplicates把城市提取出来,复制到exce中利用vlookup函数匹配城市名称和编码(提前在excel中将城市名称和编码对应的数据弄好),再复制进stata,最后利用每个城市自动赋予的stata编码进行匹配,就可以了

藤椅
Raymond.K 学生认证  发表于 2021-11-24 15:15:48
bluce-lee 发表于 2021-11-23 21:23
已经搞定了。第一步encode转换为数值型,然后通过duplicates把城市提取出来,复制到exce中利用vlookup函数 ...
其实。。。在已有值标签定义的情况下,是可以直接将城市转换成既定的代码的。。形如:
  1. encode varname , generate(newvar) label(name) noextend
复制代码

板凳
黃河泉 在职认证  发表于 2021-11-24 21:51:50
不是直接用字符变量 merge 即可吗?

报纸
bluce-lee 发表于 2021-11-26 12:18:32
黃河泉 发表于 2021-11-24 21:51
不是直接用字符变量 merge 即可吗?
我之前不知道字符变量也可以直接merge,以为要数值型。那样只要merge一次就可以了,下次试试

地板
bluce-lee 发表于 2021-11-26 12:28:54
Raymond.K 发表于 2021-11-24 15:15
其实。。。在已有值标签定义的情况下,是可以直接将城市转换成既定的代码的。。形如:
前提是需要已有值标签,这个还不知道怎么设置将标签和城市编码一一对应

7
Raymond.K 学生认证  发表于 2021-11-26 15:23:30
bluce-lee 发表于 2021-11-26 12:28
前提是需要已有值标签,这个还不知道怎么设置将标签和城市编码一一对应
可以将第二个数据库的值标签导出,再导入第一个数据文件里。不过,为了兼容更多数据库,建议一开始就将城市用国标编码定义

8
沈毓淑 发表于 2021-11-26 19:17:01
Raymond.K 发表于 2021-11-26 15:23
可以将第二个数据库的值标签导出,再导入第一个数据文件里。不过,为了兼容更多数据库,建议一开始就将城 ...
非常赞成一开始就用统一的标准代码,方便合并各种包含省份/城市的数据集

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-24 14:08