发帖

楼主: 我是小趴菜

558 0

[数据挖掘新闻] 读入单个pandas数据帧时发生错误 [推广有奖]

0关注
4粉丝

教授

35%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 29650 个
通用积分: 380.5350
学术水平: 1 点
热心指数: 1 点
信用等级: 0 点
经验: 7150 点
帖子: 670
精华: 0
在线时间: 37 小时
注册时间: 2022-8-30
最后登录: 2023-4-4

楼主

我是小趴菜 发表于 2022-10-12 14:05:19 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

我试图从本地目录中读取多个文本文件到一个单独的pandas数据帧。由于原始的文本文件来与额外的文件扩展名我改名吧，毕竟，然后我试图通过阅读所有文本文件到单个数据帧read_csv和concat从pandas。问题是，我能够读取带有pandas的单个文本文件，但是当我尝试将本地目录中的文本文件列表读入单个数据帧时，出现以下错误：

folder = 'fakeNewsDatasets[Rada]/fakeNewsDataset/fake'

allfiles=os.listdir(folder)

print(allfiles)

['biz01.txt',

'biz02.txt',

'biz03.txt',

'biz04.txt',

'biz05.txt',

然后我尝试将这些文本文件读入单个数据帧，如下所示：

dfs=pd.concat([pd.read_csv(file, header = None, sep = '\n', skip_blank_lines = True) for file in allfiles], axis=1)

*

FileNotFoundError：[Errno 2]文件b'biz02.txt'不存在：b'biz02.txt'*

我不明白为什么会出现这个问题，因为将单个文本文件读取到pandas dataframe对我来说效果很好。

df = pd.read_csv('biz01.txt', header = None, sep = '\n', skip_blank_lines = True)

df=df.T

df.columns = ['headline', 'text']

解决办法：使用glob()它会更容易：

import glob

allfiles=glob.glob('C:\\folder1\\*.csv')

否则，你可能有加盟路径file，在做for file in allfiles阅读文件时pd.read_csv()

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：pandas panda 数据帧 Das Dataframe

[数据挖掘新闻] 读入单个pandas数据帧时发生错误 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[数据挖掘新闻] 读入单个pandas数据帧时发生错误 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群