楼主: 幸运符
285 0

[书籍介绍] [2020年书籍] Pandas 1.x 手册 - 第二版(中文书签) [分享]

  • 1关注
  • 19粉丝

教授

42%

还不是VIP/贵宾

-

威望
0
论坛币
22039 个
通用积分
108.3472
学术水平
35 点
热心指数
51 点
信用等级
34 点
经验
58429 点
帖子
1850
精华
0
在线时间
775 小时
注册时间
2013-6-12
最后登录
2020-7-12

幸运符 发表于 2020-5-26 15:34:15 |显示全部楼层
Pandas 1.x Cookbook:使用Python进行科学计算,时间序列分析和探索性数据分析的实用手册
马特·哈里森(Matt Harrison),西奥多·彼得罗(Theodore Petrou)
年:2020年
版:2
发布者:派克出版
语言:英语
页数:626  627
国际标准书号10:1839213108
ISBN 13:9781839213106

Pandas 1.x Cookbook - 第二版-中文书签.pdf (5.25 MB, 需要: 2 个论坛币)

cover.jpg


目录

第一章:Pandas基础
DataFrame属性
|---- 了解数据类型
|---- 选择列
|---- 调用序列方法
|---- 串联操作
|---- 链式级数法
|---- 重命名列名
|---- 创建和删除列
第2章:基本DataFrame操作
|---- 选择多个DataFrame列
|---- 使用方法选择列
|---- 列名排序
|---- 汇总DataFrame
|---- 链接DataFrame方法
|---- DataFrame操作
|---- 比较缺少的值
|---- 改变DataFrame操作的方向
|---- 大学校园多样性的确定
第3章:创建和持久化DataFrame
|---- 从头开始创建DataFrame
|---- 编写CSV
|---- 读取大型CSV文件
|---- 使用Excel文件
|---- 使用ZIP文件
|---- 使用数据库
|---- 读取JSON
|---- 读取HTML表
第四章:开始数据分析
|---- 开发数据分析例程
|---- 数据字典
|---- 通过更改数据类型减少内存
|---- 最大最小的选择
|---- 通过排序选择每组中最大的一个
|---- 使用sort_values生成nlargest
|---- 计算后续停止订单价格
第五章:探索性数据分析
|---- 汇总统计
|---- 列类型
|---- 分类数据
|---- 连续数据
|---- 比较不同类别的连续值
|---- 比较两个连续列
|---- 比较分类和分类值
|---- 使用pandas分析库
第6章:选择数据子集
|---- 选择系列数据
|---- 选择DataFrame行
|---- 同时选择DataFrame行和列
|---- 选择包含整数和标签的数据
|---- 字典式切片
第7章:筛选行
|---- 计算布尔统计
|---- 构造多布尔条件
|---- 布尔数组过滤
|---- 比较行筛选和索引筛选
|---- 使用唯一索引和排序索引进行选择
|---- 转换SQL WHERE子句
|---- 用查询方法提高布尔索引的可读性
|---- 使用.where方法保持序列大小
|---- 屏蔽DataFrame行
|---- 使用布尔值、整数位置和标签进行选择
第8章:索引对齐
|---- 检查索引对象
|---- 生产笛卡尔产品
|---- 爆炸式索引
|---- 用不等索引填充值
|---- 从不同DataFrame添加列
|---- 突出显示每个列的最大值
|---- 用方法链复制idxmax
|---- 查找最常见的最大列数
第9章:聚合、过滤和转换的分组
|---- 定义聚合
|---- 使用多个列和函数进行分组和聚合
|---- 分组后删除多索引
|---- 使用自定义聚合函数分组
|---- 使用args和*kwargs自定义聚合函数
|---- 检查groupby对象
|---- 过滤少数民族占多数的国家
|---- 预计减肥赌局
|---- 使用apply计算每个州的加权平均SAT分数
|---- 按连续变量分组
|---- 计算城市间的航班总数
|---- 寻找最长的连续准点航班
第十章:数据整理
|---- 用堆栈将变量值整理为列名
|---- 使用melt将变量值整理为列名
|---- 同时叠加多组变量
|---- 反转堆叠数据
|---- 在groupby聚合后取消堆栈
|---- 使用groupby聚合复制pivot_table
|---- 重命名轴级别以便于重塑形状
|---- 当多个变量存储为列名时进行整理
|---- 当多个变量存储为一列时进行整理
|---- 当两个或多个值存储在同一单元格中时进行整理
|---- 当变量存储在列名和值中时进行整理
第11章:结合Pandas对象
|---- 向DataFrame追加新行
|---- 将多个DataFrame连接在一起
|---- 理解concat、join和merge之间的区别
|---- 连接到SQL数据库
第十二章:时间序列分析
|---- 理解Python和pandas日期工具之间的区别
|---- 时间序列的智能切片
|---- 使用时间数据筛选列
|---- 使用仅适用于DatetimeIndex的方法
|---- 计算每周的犯罪次数
|---- 将每周的犯罪和交通事故分开汇总
|---- 按工作日和年份衡量犯罪
|---- 使用带有DatetimeIndex的匿名函数分组
|---- 按时间戳和另一列分组
第13章:用Matplotlib、Pandas和Seaborn可视化
|---- matplotlib入门
|---- matplotlib的面向对象指南
|---- 用matplotlib可视化数据
|---- 使用Pandas绘制基础
|---- 可视化航班数据集
|---- 堆叠面积图以发现新趋势
|---- 了解seaborn与Pandas的区别
|---- 基于seaborn网格的多元分析
|---- 用seaborn揭示钻石数据集中的辛普森悖论
第14章:调试和测试Pandas
|---- 转换数据的代码
|---- 应用性能
|---- 使用Dask、Pandarell、Swifter等提高应用性能
|---- 检验代码
|---- 在Jupyter中调试
|---- 以极高的期望管理数据完整性
|---- 对Pandas使用pytest
|---- 用假设生成检验
索引

关键词:pandas panda Das 中文书 Matplotlib

已有 1 人评分经验 收起 理由
yunnandlg + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

踏实一些,不要着急,你想要的,岁月都会给你。
您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2020-7-13 10:24