楼主: 科研吗喽
1088 3

[数据管理求助] stata/python数据清洗 [推广有奖]

  • 0关注
  • 0粉丝

高中生

65%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0436
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
170 点
帖子
16
精华
0
在线时间
54 小时
注册时间
2024-1-23
最后登录
2025-2-23

楼主
科研吗喽 发表于 2024-8-16 22:49:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教各位大佬,可能是个有点复杂的问题。我的数据中有以下几个变量:year newzlid 专利类型 发明设计人 申请人 match。year的值都是一样的;match是对申请人变量操作得来的。现在我想做一个year-match-申请人-专利信息的数据集,意思就是,对于同一个“year-match-申请人”,可能有多个专利信息,我希望这些专利信息可以横向合并。


例如:
year        match    申请人    newzlid    专利类型     发明设计人
2024        M1          A            ZL1          类型1         设计人1
2024        M1          A            ZL2          类型2         设计人2
2024        M1          B            ZL3          类型1         设计人3
2024        M2          A            ZL4          类型1         设计人4








最后得到类似于这样的结果:
2024        M1        A        ZL1        类型1        设计人1        ZL2        类型2        设计人2
2024        M1        B        ZL3        类型1        设计人3        NaN        NaN        NaN
2024        M2        A        ZL4        类型1        设计人4        NaN        NaN        NaN


这在stata中可以直接操作吗?如果不能,Python中的代码应该怎么写?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python Stata tata Match year

沙发
Janik 学生认证  发表于 2024-8-21 19:16:05
可以看下stata的merge代码;python的话可以问问chatgpt

藤椅
qianchen 发表于 2024-8-25 11:14:44
bys year match 申请人:gen id=_n
reshape wide 专利类型   发明设计人  newzlid ,i(year match 申请人) j(id)

板凳
科研吗喽 发表于 2024-8-28 11:06:50
qianchen 发表于 2024-8-25 11:14
bys year match 申请人:gen id=_n
reshape wide 专利类型   发明设计人  newzlid ,i(year match 申请人)  ...
理论上是可以,但是数据量太大了,stata一直报错

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-7 23:31