于是,我找到Python在全社会最常见、最广泛的使用场景,那就是收集数据、处理Excel表格、做数据分析,简单来说就是代替Excel的复杂操作,实现高效办公。而Pandas正是解决这方面问题的专业数据科学库。Pandas既能完成上述这些基础操作,又能在数据建模、机器学习等更高层次的领域发挥重要作用。
《深入浅出Pandas利用Python进行数据处理与分析》PDF+数据集+李庆辉
《深入浅出Pandas利用Python进行数据处理与分析》PDF,676页,有书签,文字可复制;李庆辉著
下载: https://pan.baidu.com/s/1oT31Ccee6bW1d4ZJuEgz-A?pwd=kvj6
提取码: kvj6
所以,对于Python的初学者,我都建议直接学Pandas,因为一来它能应对上述真实需求,学完就能解决问题;二来随着学习的深入,你会发现不论哪个领域都需要一个数据结构来承载数据,而Pandas提供的Series和DataFrame结构正好解决了这个问题。
如同Python在诸多领域有广泛应用一样,Pandas处理的是数据问题,同样在各行各业都能展现其魅力,阅读本书需要掌握一点Python的语法、数据结构和函数方面的基础知识,不过零基础的读者也完全可以理解本书的内容,介绍Python环境的安装和Python的数据结构,方便初学者入门学习。
共17章,分为七部分,全面介绍了如何利用Pandas进行数据处理和数据分析。
第一部分(第1~2章) Pandas 入门
首先介绍了Pandas的功能、使用场景和学习方法,然后详细讲解了 Python 开发环境的搭建,最后介绍了Pandas的大量基础功能,旨在引领读者快速入门。
第二部分(第3~5章) Pandas 数据分析基础
详细讲解了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
讲解了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,以及如何利用多层索引对数据进行升降维。
第四部分(第10~12章) 数据清洗
讲解了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,以及分类数据的应用场景和操作方法。
第五部分(第13~14章)时序数据分析
讲解了Pandas中对于各种时间类型数据的处理和分析,以及在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据自己说话。
第七部分(第17章) 实战案例
介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈,此外还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。
使用Pandas是一项技能,需要多动手实践才能熟练掌握。紧跟书中的思路,对照书中的代码,自己输入电脑中运行,然后在工作和生活中发现应用场景,去解决实际问题。多看看Pandas官方文档,学会看API说明,如果有能力,可以看看源码的实现,让自己对Pandas的掌握更上一层楼。