楼主: 不二不幸福
2508 10

[问答] 用python进行数据过滤 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

32%

还不是VIP/贵宾

-

威望
0
论坛币
181 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1591 点
帖子
76
精华
0
在线时间
159 小时
注册时间
2017-9-26
最后登录
2022-3-30

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现有数据如下图,一共有5个样本,每个样本又包括cov和met两项,position这一列是所有样本共用的,有些数据没有,所以用NA表示,现在要对这个数据进行过滤,要求是①最多只能有3个样本(也就是6列)出现NA,否则就过滤掉
②每个样本的met相加求平均值,平均值>5则过滤
通过上述两个条件的被保留下来,请问这个代码该怎么写?
捕获.PNG



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python position 平均值 求平均 OSI

沙发
gjinwei 发表于 2018-1-23 11:23:14 |只看作者 |坛友微信交流群
楼主最好上传下资料。

使用道具

藤椅
不二不幸福 发表于 2018-1-23 11:41:26 |只看作者 |坛友微信交流群
这是数据

data.xlsx

45.15 KB

使用道具

板凳
不二不幸福 发表于 2018-1-23 11:41:48 |只看作者 |坛友微信交流群
gjinwei 发表于 2018-1-23 11:23
楼主最好上传下资料。
多谢提醒,已上传

使用道具

报纸
gjinwei 发表于 2018-1-23 13:29:29 |只看作者 |坛友微信交流群
下列实现供参考:
  1. import pandas as pd
  2. df1 = pd.read_excel(r'd:\data.xlsx')

  3. df1[(df1.filter(regex='met').mean(axis=1)<=5)&(df1.count(axis=1)>=6)]
复制代码

使用道具

地板
不二不幸福 发表于 2018-1-23 20:33:54 |只看作者 |坛友微信交流群
gjinwei 发表于 2018-1-23 13:29
下列实现供参考:
我python是2.7的,是不是用不了pandas啊

使用道具

7
gjinwei 发表于 2018-1-23 20:54:55 |只看作者 |坛友微信交流群
不二不幸福 发表于 2018-1-23 20:33
我python是2.7的,是不是用不了pandas啊
可以用的
Python version support¶
Officially Python 2.7, 3.5, and 3.6.

使用道具

8
不二不幸福 发表于 2018-1-23 21:12:18 |只看作者 |坛友微信交流群
gjinwei 发表于 2018-1-23 20:54
可以用的
Python version support¶
Officially Python 2.7, 3.5, and 3.6.
我怎么总是报错,用的sublime text
Traceback (most recent call last):
  File "ceshi.py", line 1, in <module>
    import pandas as pd
ImportError: No module named 'pandas'

使用道具

9
gjinwei 发表于 2018-1-23 21:27:45 |只看作者 |坛友微信交流群
下载anaconda安装,集成了很多第三方的包anaconda

使用道具

10
whbscut 学生认证  发表于 2018-1-23 21:43:59 |只看作者 |坛友微信交流群
不二不幸福 发表于 2018-1-23 21:12
我怎么总是报错,用的sublime text
Traceback (most recent call last):
  File "ceshi.py", line 1, i ...
你没有安装pandas

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 22:06