楼主: 我是小趴菜
531 0

[数据挖掘新闻] 在python中解析CSV的特定列 [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-10-12 14:10:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

所以我有这个CSV,我想做以下事情:


原始数据:


在此输入图像描述


解析数据:


在此输入图像描述


所以,换句话说,如果列有逗号,那么我想创建一个只有一个值的新列,并删除具有多个值的列。


例如:N2有I1,I3和I4。因此,新数据获得3列,仅包含一个值。


我想以这样的方式使它变得动态,以便反映所有的排列。就像N3的情况一样,它有2个位置和2个项目。


我正在尝试使用python的pandas来做到这一点。一些帮助将不胜感激。

解决办法:df['Place'] = df['Place'].str.split(',')

df['Item'] = df['Item'].str.split(',')


exploded = pd.DataFrame([

a + [p, t] for *a, P, T in df.values

for p in P for t in T

], columns=df.columns)

并输出:


Name Place Item

0 N1 P1 I1

1 N2 P2 I1

2 N2 P2 I3

3 N2 P2 I4

4 N3 P2 I2

5 N3 P2 I5

6 N3 P3 I2

7 N3 P3 I5


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python Dataframe columns column values

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-10 23:48