楼主: CDA网校
4534 24

[数据挖掘新闻] Python数据分析入门教程 [推广有奖]

11
CDA网校 学生认证  发表于 2020-2-13 15:02:16 |只看作者 |坛友微信交流群

6、 median求中位数

中位数就是将一组含有n个数据的序列X按从小到大排列,位于中间位置的那个数。

中位数是以中间位置的数来反映数据的一般情况,不容易受到极大值、极小值的影响,因而在反映数据分布情况上要比平均值更有代表性。

现有序列为X:{X1、X2、X3、......、Xn}。

如果n为奇数,则中位数:

如果n为偶数,则中位数:

例如,1、3、5、7、9的中位数为5,而1、3、5、7的中位数为(3+5)/2=4。

在Excel和Python中求一组数据的中位数,都是使用median()函数来实现的。

下面为在Excel中求中位数的示例:

在Python中,median()函数的使用原则和其他函数的一致。

7、mode求众数

顾名思义,众数就是一组数据中出现次数最多的数,求众数就是返回这组数据中出现次数最多的那个数。

在Excel和Python中求众数都使用mode()函数,使用原则与其他函数完全一致。

在Excel中求众数的示例如下:

在Python中求众数的示例如下:

8、var求方差

方差是用来衡量一组数据的离散程度(即数据波动幅度)的。

在Excel和Python中求一组数据中的方差都使用var()函数。

下面为在Excel中求方差的示例:

在Python中,var()函数的使用原则和其他函数的一致。

9、std求标准差

标准差是方差的平方根,二者都是用来表示数据的离散程度的。

在Excel中计算标准差使用的是stdevp()函数,示例如下:

在Python中计算标准差使用的是std()函数,std()函数的使用原则与其他函数的一致,示例如下:

10、quantile求分位数

分位数是比中位数更加详细的基于位置的指标,分位数主要有四分之一分位数、四分之二分位数、四分之三分位数,而四分之二分位数就是中位数。

在Excel中求分位数用的是percentile()函数,示例如下:

在Python中求分位数用的是quantile()函数,要在quantile后的括号中指明要求取的分位数值,quantile()函数与其他函数的使用规则相同。

四、相关性运算

相关性常用来衡量两个事物之间的相关程度,比如我们前面举的例子:啤酒与尿布二者的相关性很强。我们一般用相关系数来衡量两者的相关程度,所以相关性计算其实就是计算相关系数,比较常用的是皮尔逊相关系数。

在Excel中求取相关系数用的是correl()函数,示例如下:

在Python中求取相关系数用的是corr()函数,示例如下:

还可以利用 corr()函数求取整个 DataFrame 表中各字段两两之间的相关性,示例如下:


使用道具

12
samzhang_bj 发表于 2020-2-14 07:44:39 |只看作者 |坛友微信交流群
thanks for sharing

使用道具

13
soledadchao 发表于 2020-3-17 00:06:26 |只看作者 |坛友微信交流群
谢谢你,这个资料很好

使用道具

14
fwdd 发表于 2020-3-22 22:29:12 |只看作者 |坛友微信交流群
挺好的

使用道具

15
pyx1548 学生认证  发表于 2020-4-9 22:08:33 |只看作者 |坛友微信交流群

使用道具

16
春梦了 发表于 2020-4-30 08:54:51 |只看作者 |坛友微信交流群
[em23][em23]

使用道具

17
hfly2005 发表于 2020-7-29 20:47:14 |只看作者 |坛友微信交流群
很好的教程,详细明了!!!

使用道具

18
novelbean 发表于 2020-8-2 10:43:09 |只看作者 |坛友微信交流群
谢谢,这个资料不错,学习学习

使用道具

19
wghxyz 发表于 2020-8-25 17:52:17 |只看作者 |坛友微信交流群
多谢分型,是入门者的福利

使用道具

20
smile2020888 发表于 2020-9-14 09:29:33 |只看作者 |坛友微信交流群
很不错的python教程

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 08:27