签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

经管百科

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛 › Scikit-Learn 流形学习（manifold learning）

楼主: casey_c

2156 1

[程序分享] Scikit-Learn 流形学习（manifold learning） [推广有奖]

0关注
10粉丝

博士生

92%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 96 个
通用积分: 2.1003
学术水平: 2 点
热心指数: 15 点
信用等级: 2 点
经验: 11502 点
帖子: 278
精华: 0
在线时间: 94 小时
注册时间: 2016-11-22
最后登录: 2022-5-2

楼主

casey_c 发表于 2017-7-4 11:43:37 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

流形学习（manifold learning）是机器学习、模式识别中的一种方法，在维数约简方面具有广泛的应用。本节将向大家介绍在 Python 中利用 Scikit-Learn 工具库实现流形学习的一系列方法与技巧。

首先需要导入相关的可视化工具库，并构造本节的第一个示例数据：

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np

复制代码

构建如下函数 make_hello 用于示例数据集构建：

def make_hello(N=1000, rseed=42):
# 绘制一个“HELLO”形状，并将它保存为png
fig, ax = plt.subplots(figsize=(4, 1))
fig.subplots_adjust(left=0, right=1, bottom=0, top=1)
ax.axis('off')
ax.text(0.5, 0.4, 'HELLO', va='center', ha='center',
weight='bold', size=85)
fig.savefig('hello.png')
plt.close(fig)
# 打开这个 PNG，并根据图片生成随机散点
from matplotlib.image import imread
data = imread('hello.png')[::-1, :, 0].T
rng = np.random.RandomState(rseed)
X = rng.rand(4 * N, 2)
i, j = (X * data.shape).astype(int).T
mask = (data[i, j] < 1)
X = X[mask]
X[:, 0] *= (data.shape[0] / data.shape[1])
X = X[:N]
return X[np.argsort(X[:, 0])]

复制代码

构建示例数据集 X，一组拼接成“HELLO”字样的散点样本：

X = make_hello(1000)
colorize = dict(c=X[:, 0], cmap=plt.cm.get_cmap('rainbow', 5))
plt.scatter(X[:, 0], X[:, 1], **colorize)
plt.axis('equal');

复制代码

我们构建的数据样本如上所示，接下来我们对样本点的坐标进行以下旋转，将旋转后的数据集命名为 X2：

def rotate(X, angle):
theta = np.deg2rad(angle)
R = [[np.cos(theta), np.sin(theta)],
[-np.sin(theta), np.cos(theta)]]
return np.dot(X, R)
X2 = rotate(X, 20) + 5
plt.scatter(X2[:, 0], X2[:, 1], **colorize)
plt.axis('equal');

复制代码

为了直观地展现流形学习，我们运用 Scikit-Learn 中的 pairwise_distances 工具计算样本点两两之间的距离指标，并存储为矩阵 D：

from sklearn.metrics import pairwise_distances
D = pairwise_distances(X)
D.shape

复制代码

(1000, 1000)
我们可以用像素图来描绘矩阵 D 中的内容，1000 个样本点中两两间的距离如下图所示：

plt.imshow(D, zorder=2, cmap='Blues', interpolation='nearest')
plt.colorbar();

复制代码

可以看到，X2 与 X 中样本点两两间的距离不会因为整体旋转而改变：

D2 = pairwise_distances(X2)
np.allclose(D, D2)

复制代码

True
以上内容节选自数析学院，后文还有三维数据集处理、图像处理实例等，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

已有 2 人评分	经验	论坛币	收起理由
晓七	+ 100		精彩帖子
残阳_等待	+ 60	+ 10	精彩帖子

总评分: 经验 + 160 论坛币 + 10 查看全部评分

回复

沙发

casey_c 发表于 2017-7-7 14:11:45

回复

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明