楼主: casey_c
706 1

[程序分享] Scikit-Learn 库简介 [推广有奖]

  • 0关注
  • 10粉丝

博士生

92%

还不是VIP/贵宾

-

威望
0
论坛币
96 个
通用积分
2.0091
学术水平
2 点
热心指数
15 点
信用等级
2 点
经验
11502 点
帖子
278
精华
0
在线时间
94 小时
注册时间
2016-11-22
最后登录
2022-5-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文

下面将向大家介绍 Python 中大名鼎鼎的机器学习工具库 Scikit-Learn。
为了使大家能更加清晰地了解 Scikit-Learn 中的相关功能,我们先对本节要用到的实例数据集 iris 做一个简单的介绍:

  1. import seaborn as sns
  2. iris = sns.load_dataset('iris')
  3. iris.head()
复制代码

1.jpg

iris 是机器学习分类研究中常用的一个经典数据集,可以看到,这个数据集包含了鸢尾花萼片与花瓣的长宽信息,并且包含了每一株鸢尾花的种类标记。利用 Seaborn 库,我们可以绘制下列样本特征分布图,来查看样本在不同特征维度下的分布情况:


  1. %matplotlib inline
  2. import seaborn as sns; sns.set()
  3. sns.pairplot(iris, hue='species', size=1.5);
复制代码

2.jpg

为了更方便地使用 Python 中机器学习的相关工具,我们有必要对样本的特征数据与分类标记进行一下划分,将其分别保存为 X_iris 与 y_iris:


  1. X_iris = iris.drop('species', axis=1)
  2. X_iris.shape
复制代码
(150, 4)
  1. y_iris = iris['species']
  2. y_iris.shape
复制代码
(150,)
好了,准备工作已经就绪,现在我们先把这份数据放在一边。为了更好地介绍 Scikit-Learn ,我们先来看一下线性回归模型的构建方法:我们构建了如下示例数据:
  1. import matplotlib.pyplot as plt
  2. import numpy as np

  3. rng = np.random.RandomState(42)
  4. x = 10 * rng.rand(50)
  5. y = 2 * x - 1 + rng.randn(50)
  6. plt.scatter(x, y);
复制代码

3.jpg
导入 Scikit-Learn 中的对应模块:
  1. from sklearn.linear_model import LinearRegression
复制代码

模型参数设置:
  1. model = LinearRegression(fit_intercept=True)
  2. model
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
  1. X = x[:, np.newaxis]
  2. X.shape
复制代码
(50, 1)
模型拟合:
  1. model.fit(X, y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
线性回归参数估计结果:
  1. model.coef_
复制代码
array([ 1.9776566])
  1. model.intercept_
复制代码
-0.90331072553111458
后文还有介绍 Scikit-Learn 的几个机器学习的常用工具,内容较多,先搬运到这,有需要的同学可以先直接到 数析学院 查看原文

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:scikit-learn Learn Earn ear SCI

沙发
casey_c 发表于 2017-6-7 17:39:20 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 18:19