楼主: 我是小趴菜
470 0

[数据挖掘新闻] pandas 读取文件时把'NA'字符串读作空值,但是这个并不是真的空值,怎么解决? [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-11-14 10:25:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

问:pandas 读取文件时把'NA'字符串读作空值,但是这个并不是真的空值,怎么解决?


答:pandas 读取文本的时候会默认将如下字符串作为空值处理:

‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IND’, ‘1.#QNAN’, ‘<NA>’, ‘N/A’, ‘NA’, ‘NULL’, ‘NaN’, ‘n/a’, ‘nan’, ‘null’。

这个主要由na_values与keep_default_na这两个个参数控制,详情可参考:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html?highlight=read_csv


那么如何去使用这些参数呢?


na_values:决定哪些值可以表示为缺失值,默认的缺失值表示方式: ‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IND’, ‘1.#QNAN’, ‘<NA>’, ‘N/A’, ‘NA’, ‘NULL’, ‘NaN’, ‘n/a’, ‘nan’, ‘null’。

keep_default_na:决定是否保留na_values默认的缺失值表示方式,

- 当参数为True时pandas会将文件中所有与默认的缺失值表达形式一致的字符串作为空值(nan)处理,这时如果na_values被传入其他参数那这个传入的参数所代表的值也按缺失值处理。

- 当参数取值为False时,pandas会将na_values的默认值关闭,如果na_values没有被赋值,那么源文件中出现什么值,DataFrame中就是什么值。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:pandas panda 读取文件 Das 字符串

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 21:19