如何将同一行的几个单元格，逗号隔开的字符串分割后，匹配形成不同观察值？ - Stata专版

3关注
0粉丝

已卖：1份资源

博士生

20%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 430 个
通用积分: 3.7500
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 464 点
帖子: 34
精华: 0
在线时间: 469 小时
注册时间: 2012-5-1
最后登录: 2025-3-30

楼主

pokman 发表于 2018-6-29 16:46:03 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

已有数据形态如下：

* Example generated by -dataex-. To install: ssc install dataex
clear
input str16 name str4 year str8 gender str16 origins
"王伟,刘霞,范仕宽" "2015" "男,女,男" "安徽,哈尔滨,辽宁"
"何一文,刘明" "2015" "男,男" "浙江,福建"
"范艳,毛军" "2016" "女,男" "福建，上海"
"龚华,李阳阳" "2016" "男,男" "安徽，江苏"
end

复制代码

想要通过数据处理形成以下的对应关系：

姓名	年份	性别	出生地
王伟	2015	男	安徽
刘霞	2015	女	哈尔滨
范仕宽	2015	男	辽宁

请问stata是否可以实现，如何实现？
若无法使用stata实线请问可以通过什么方法实现？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：如何实现方法实现对应关系数据处理出生地字符串数据处理单元格拆分匹配值

回帖推荐

黃河泉发表于2楼查看完整内容

你若要问程序，永远附上资料；若要附上资料，永远用 dataex 印出资料；先 ssc install dataex (并见说明)，将原始 Stata 资料中具有”代表性”的一部分资料列出，以供有意回答者实验之用，并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769, https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。

黃河泉发表于4楼查看完整内容

Nick Cox 建议：

沙发

黃河泉

发表于 2018-6-29 16:51:51

你若要问程序，永远附上资料；若要附上资料，永远用 dataex 印出资料；先 ssc install dataex (并见说明)，将原始 Stata 资料中具有”代表性”的一部分资料列出，以供有意回答者实验之用，并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769, https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。

藤椅

pokman 发表于 2018-6-29 17:07:40

黃河泉发表于 2018-6-29 16:51
你若要问程序，永远附上资料；若要附上资料，永远用 dataex 印出资料；先 ssc install dataex (并见说明)， ...

不好意思第一次提问

板凳

黃河泉

发表于 2018-6-29 18:27:34

pokman 发表于 2018-6-29 17:07
不好意思第一次提问

Nick Cox 建议：

* Example generated by -dataex-. To install: ssc install dataex
clear
input str25 name str4 year str12 gender str26 origins
"王伟,刘霞,范仕宽" "2015" "男,女,男" "安徽,哈尔滨,辽宁"
"何一文,刘明" "2015" "男,男" "浙江,福建"
"范艳,毛军" "2016" "女,男" "福建，上海"
"龚华,李阳阳" "2016" "男,男" "安徽，江苏"
end
ren origins ori
gen origins = subinstr(ori,"，",",",3)
drop ori
split name, p(,)
split gender, p(,)
split origins, p(,)
gen long id = _n
drop name origins gender
reshape long name origins gender, i(id) j(whatever)
drop if missing(name) & missing(gender) & missing(origins)
list, sepby(id)

复制代码

已有 1 人评分	论坛币	学术水平	热心指数	收起理由
逐梦的太阳	+ 5	+ 5	+ 5	热心帮助其他会员

总评分: 论坛币 + 5 学术水平 + 5 热心指数 + 5 查看全部评分

报纸

黃河泉

发表于 2018-6-29 18:27:50

pokman 发表于 2018-6-29 17:07
不好意思第一次提问

. list, sepby(id)
+--------------------------------------------------+
| id whatever year name gender origins |
|--------------------------------------------------|
1. | 1 1 2015 王伟男安徽 |
2. | 1 2 2015 刘霞女哈尔滨 |
3. | 1 3 2015 范仕宽男辽宁 |
|--------------------------------------------------|
4. | 2 1 2015 何一文男浙江 |
5. | 2 2 2015 刘明男福建 |
|--------------------------------------------------|
6. | 3 1 2016 范艳女福建 |
7. | 3 2 2016 毛军男上海 |
|--------------------------------------------------|
8. | 4 1 2016 龚华男安徽 |
9. | 4 2 2016 李阳阳男江苏 |
+--------------------------------------------------+

复制代码

地板

pokman 发表于 2018-6-29 18:36:37

黃河泉发表于 2018-6-29 18:27
Nick Cox 建议：

多谢老师慷慨解答！

7楼

pokman 发表于 2018-6-29 18:40:37

总结一下：
1.split指令分割字符串
2.reshape重新构造数据

[数据管理求助] 如何将同一行的几个单元格，逗号隔开的字符串分割后，匹配形成不同观察值？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

回帖推荐

浏览过的帖子

浏览过的版块

本版微信群

[数据管理求助] 如何将同一行的几个单元格，逗号隔开的字符串分割后，匹配形成不同观察值？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

回帖推荐

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群