人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛 › Scikit-Learn 主成分分析

发帖

楼主: casey_c

1699 3

[程序分享] Scikit-Learn 主成分分析 [推广有奖]

0关注
10粉丝

博士生

92%

还不是VIP/贵宾

威望: 0 级
论坛币: 96 个
通用积分: 2.1003
学术水平: 2 点
热心指数: 15 点
信用等级: 2 点
经验: 11502 点
帖子: 278
精华: 0
在线时间: 94 小时
注册时间: 2016-11-22
最后登录: 2022-5-2

楼主

casey_c 发表于 2017-6-30 16:51:25 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

主成分分析是数据科学中常见的降维方法，今天将向大家介绍在 Python 中利用 Scikit-Learn 工具包进行主成分分析的方法与技巧。

首先导入相关的可视化库，并构建示例数据：

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

复制代码

rng = np.random.RandomState(1)
X = np.dot(rng.rand(2, 2), rng.randn(2, 200)).T
plt.scatter(X[:, 0], X[:, 1])
plt.axis('equal');

复制代码

如上所示，第一组示例数据为一组样本量为200的随机的二维数组。接下来我们导入 Scikit-Learn 中用于主成分分析的 PCA 模块，构建一个主成分分析模型对象，并进行训练。在这次构建中，我们设定 PCA 函数的参数 n_components 为2，这意味这我们将得到特征值最大的两个特征向量：

from sklearn.decomposition import PCA
pca = PCA(n_components=2)
pca.fit(X)

复制代码

PCA(copy=True, n_components=2, whiten=False)
模型训练完成后， components_ 属性可以查看主成分分解的特征向量：

print(pca.components_)

复制代码

[[ 0.94446029 0.32862557] [ 0.32862557 -0.94446029]]
explained_variance_ 属性可以中查看各个主成分的解释方差：

print(pca.explained_variance_)

复制代码

[ 0.75871884 0.01838551]
我们可以通过如下方式将主成分分析中的特征向量描绘出来，下图中向量的起点为样本数据的均值向量：

def draw_vector(v0, v1, ax=None):
ax = ax or plt.gca()
arrowprops=dict(arrowstyle='->',
linewidth=2,
shrinkA=0, shrinkB=0)
ax.annotate('', v1, v0, arrowprops=arrowprops)
# 描绘数据
plt.scatter(X[:, 0], X[:, 1], alpha=0.2)
for length, vector in zip(pca.explained_variance_, pca.components_):
v = vector * 3 * np.sqrt(length)
draw_vector(pca.mean_, pca.mean_ + v)
plt.axis('equal');

复制代码

以上内容节选自数析学院，后文还有介绍参数调整、图像降维实例等，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：scikit-learn 主成分分析 Learn Earn ear

[程序分享] Scikit-Learn 主成分分析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级学术勋章

初级热心勋章

本版微信群

[程序分享] Scikit-Learn 主成分分析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级学术勋章

初级热心勋章

本版微信群

扫码加我拉你入群