楼主: 不二不幸福
3213 10

[问答] 用python进行数据过滤 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
161 个
通用积分
2.8500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1641 点
帖子
76
精华
0
在线时间
160 小时
注册时间
2017-9-26
最后登录
2024-6-14

楼主
不二不幸福 发表于 2018-1-23 10:18:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现有数据如下图,一共有5个样本,每个样本又包括cov和met两项,position这一列是所有样本共用的,有些数据没有,所以用NA表示,现在要对这个数据进行过滤,要求是①最多只能有3个样本(也就是6列)出现NA,否则就过滤掉
②每个样本的met相加求平均值,平均值>5则过滤
通过上述两个条件的被保留下来,请问这个代码该怎么写?
捕获.PNG



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python position 平均值 求平均 OSI

沙发
gjinwei 发表于 2018-1-23 11:23:14
楼主最好上传下资料。

藤椅
不二不幸福 发表于 2018-1-23 11:41:26
这是数据

板凳
不二不幸福 发表于 2018-1-23 11:41:48
gjinwei 发表于 2018-1-23 11:23
楼主最好上传下资料。
多谢提醒,已上传

报纸
gjinwei 发表于 2018-1-23 13:29:29
下列实现供参考:
  1. import pandas as pd
  2. df1 = pd.read_excel(r'd:\data.xlsx')

  3. df1[(df1.filter(regex='met').mean(axis=1)<=5)&(df1.count(axis=1)>=6)]
复制代码

地板
不二不幸福 发表于 2018-1-23 20:33:54
gjinwei 发表于 2018-1-23 13:29
下列实现供参考:
我python是2.7的,是不是用不了pandas啊

7
gjinwei 发表于 2018-1-23 20:54:55
不二不幸福 发表于 2018-1-23 20:33
我python是2.7的,是不是用不了pandas啊
可以用的
Python version support¶
Officially Python 2.7, 3.5, and 3.6.

8
不二不幸福 发表于 2018-1-23 21:12:18
gjinwei 发表于 2018-1-23 20:54
可以用的
Python version support¶
Officially Python 2.7, 3.5, and 3.6.
我怎么总是报错,用的sublime text
Traceback (most recent call last):
  File "ceshi.py", line 1, in <module>
    import pandas as pd
ImportError: No module named 'pandas'

9
gjinwei 发表于 2018-1-23 21:27:45
下载anaconda安装,集成了很多第三方的包anaconda

10
whbscut 学生认证  发表于 2018-1-23 21:43:59
不二不幸福 发表于 2018-1-23 21:12
我怎么总是报错,用的sublime text
Traceback (most recent call last):
  File "ceshi.py", line 1, i ...
你没有安装pandas

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-4 01:52