楼主: 充实每一天
6813 86

20180425【充实计划】第688期   [推广有奖]

11
shiraishisai 发表于 2018-4-25 07:19:21
昨日阅读2小时,累计阅读31.5小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

12
124613670 发表于 2018-4-25 07:21:07
昨日阅读一小时,总小时46小时  25
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

13
sq2008 发表于 2018-4-25 07:29:41
昨日阅读1小时,累计阅读101小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

14
tsangwm 发表于 2018-4-25 07:32:25
昨日阅读1小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

15
GKINGLIU 在职认证  发表于 2018-4-25 07:33:19
DAY #25

1.主题
Data analysis in Python with pandas全30集
https://www.bilibili.com/video/av6785636/?p=3

2.摘要
比较axis的不同:
drinks.mean() ——> 默认axis = 0 ,即mean按列统计
drinks.mean(axis = 1) ——>修改axis = 1后,mean按照行统计

在Series使用str方法,必须写上.str.:
orders.item_name.str.upper()
orders.item_name.str.contains('Chicken')
orders.choice_description.str.replace('[','').str.replace(']','') ——> 每调用一次str的方法,就要鞋一次.str.

用astype改变列数据的类型:
drinks.beer_servings.astype(float)
orders.item_price.str.replace('$','').astype(float) ——> 把文本先去除$,再转成数字类,然后可以做运算
orders.item_name.str.contains('Chicken').astype(int) ——>将布尔值转换为int,即0或1

读取数据时,就更改数据类型:
drinks = pd.read_csv('http://bit.ly/drinksbycountry',dtype = {'beer_servings' : float}) ——>用dtype字典

分类 & 统计:
drinks.groupby('continent').beer_servings.mean() ——>先分拣出continent各组,再分拣出beer,再做统计
drinks[drinks.continent == 'Africa'].beer_servings.mean() ——>功能等同于按照continent分组,抽取Africa组做统计
drinks.groupby('country').beer_servings.agg(['count','min','max','mean']) ——>强大的agg,可以填入多个统计量,需用列表

描述Series:
movies.genre.value_counts(normalize= True)——>分项统计,并计算出概率
movies.duration.describe() ——>用describe描述,这是Series的一个方法,对于文本或数字,得到的结果不同,所以首先更要清楚series的类型

绘制图表:
%matplotlib inline ——>首先引入matplotlib
movies.duration.plot('hist')
movies.genre.value_counts().plot('bar') ——>用.plot90就可以画图了,括弧奥内指定图表类型

缺失值:
ufo.notnull().tail() 或 ufo.isnull().tail() ——>判断是否缺失
ufo.isnull().sum() ——>分列纵向统计缺失值
ufo.dropna() ——>删除缺失值
ufo.dropna(subset = ['City','Shape Reported'],how = 'all')——> 交集删除,当两列均为空值时,删除
ufo.dropna(subset = ['City','Shape Reported'],how = 'any')——> 并集删除,当两列至少有一列为空值时,删除
ufo['Shape Reported'].value_counts(dropna=False) ——>对某一列内部分项目统计,默认不统计缺失值,当加上dropna=False,则统计缺失值
ufo['Shape Reported'].fillna(value='hello',inplace=True) ——>用hello取代缺失值,并在表格中彻底更正
movies[movies.content_rating.isnull()] ——> 显示缺失值的记录行
索引:
drinks.set_index('country',inplace=True) ——>把country作为索引列
drinks.index.name = None ——> 去除索引列的标题
drinks.loc['Chile','beer_servings'] ——>用索引列定位查找数值
drinks.index.name='country'
drinks.reset_index(inplace=True) ——>这两句恢复到原来的数字索引,但首先要声明索引名字再恢复

3.心得感悟
这位优秀讲师的思维特点:
①.分小专题单独讲解,每次只讲一个主题,各个击破 ——>化繁为简
②.善于breakdown,用简单例子讲明白底层逻辑,再回过头来继续讲解大的抽象问题 ——>类比
③.例子超多,正误对比,印象深刻 ——例证例证 + 反例
④.依循“提出问题——>分析问题——>解决问题”的逻辑讲解,行云流水一般 ——> 毛主席写作风格

4.时间统计
昨日阅读5小时,累计525小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 70 精彩帖子

总评分: 论坛币 + 70   查看全部评分

16
zgs3721 发表于 2018-4-25 08:01:53
昨天阅读2小时,总共阅读200小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

17
abcabc123 发表于 2018-4-25 08:07:10
昨日阅读2小时,累计阅读175小时。
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

18
mingke24 发表于 2018-4-25 08:07:40
昨日阅读2小时,累计135小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

19
王宋成 发表于 2018-4-25 08:08:48 来自手机
充实每一天 发表于 2018-4-25 05:12
【加入充实计划】【了解充实计划】

|新充实挑战|    |公告【想成为牛人】|
昨日2小时,累计514小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

20
yuqr1986 学生认证  发表于 2018-4-25 08:26:12
昨天阅读0.5小时,累计阅读86.5小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2026-2-2 19:44