楼主: casey_c
1851 6

[程序分享] Scikit-Learn 决策树与随机森林 [推广有奖]

  • 0关注
  • 10粉丝

博士生

92%

还不是VIP/贵宾

-

威望
0
论坛币
96 个
通用积分
2.0091
学术水平
2 点
热心指数
15 点
信用等级
2 点
经验
11502 点
帖子
278
精华
0
在线时间
94 小时
注册时间
2016-11-22
最后登录
2022-5-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文

向大家介绍在 Python 中利用 Scikit-Learn 工具库进行决策树分类器与随机森林模型建模的相关方法。

首先导入相关的的可视化工具:


  1. %matplotlib inline
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. import seaborn as sns; sns.set()
复制代码


运用 make_blobs 生成本节示例数据,300 个随机样本分为四个类型,如下图所示:

  1. from sklearn.datasets import make_blobs

  2. X, y = make_blobs(n_samples=300, centers=4,
  3.                   random_state=0, cluster_std=1.0)
  4. plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='rainbow');
复制代码


1.jpg

接下来,我们导入 Scikit-Learn 中的 DecisionTreeClassifier 工具,构建并训练一个决策树分类器:

  1. from sklearn.tree import DecisionTreeClassifier
  2. tree = DecisionTreeClassifier().fit(X, y)
复制代码
为了直观地呈现模型效果,构建如下函数 visualize_classifier :


  1. def visualize_classifier(model, X, y, ax=None, cmap='rainbow'):
  2.     ax = ax or plt.gca()
  3.    
  4.     # 绘制用于训练的样本点
  5.     ax.scatter(X[:, 0], X[:, 1], c=y, s=30, cmap=cmap,
  6.                clim=(y.min(), y.max()), zorder=3)
  7.     ax.axis('tight')
  8.     ax.axis('off')
  9.     xlim = ax.get_xlim()
  10.     ylim = ax.get_ylim()
  11.    
  12.     # 拟合估计值
  13.     model.fit(X, y)
  14.     xx, yy = np.meshgrid(np.linspace(*xlim, num=200),
  15.                          np.linspace(*ylim, num=200))
  16.     Z = model.predict(np.c_[xx.ravel(), yy.ravel()]).reshape(xx.shape)

  17.     # 根据估计结果绘制彩色区块
  18.     n_classes = len(np.unique(y))
  19.     contours = ax.contourf(xx, yy, Z, alpha=0.3,
  20.                            levels=np.arange(n_classes + 1) - 0.5,
  21.                            cmap=cmap, clim=(y.min(), y.max()),
  22.                            zorder=1)

  23.     ax.set(xlim=xlim, ylim=ylim)
复制代码


可以看到,我们训练的分类器模型以图中的色块区域将样本点划分为了不同的类型:


  1. visualize_classifier(DecisionTreeClassifier(), X, y)
复制代码
2.jpg


以上内容节选自 数析学院,后文还有介绍 其他分类工具以及数字识别实例等,内容较多,先搬运到这,有需要的同学可以先直接到 数析学院 查看原文

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:scikit-learn Learn 随机森林 Earn SCI

已有 1 人评分经验 收起 理由
残阳_等待 + 60 精彩帖子

总评分: 经验 + 60   查看全部评分

沙发
casey_c 发表于 2017-6-30 16:44:08 |只看作者 |坛友微信交流群

使用道具

藤椅
残阳_等待 发表于 2017-7-1 09:49:24 |只看作者 |坛友微信交流群
感谢分享好资源!

使用道具

板凳
ydc129 发表于 2017-7-3 00:39:36 |只看作者 |坛友微信交流群
谢谢分享

使用道具

报纸
casey_c 发表于 2017-7-4 10:31:10 |只看作者 |坛友微信交流群

使用道具

地板
xiaoying3146 发表于 2017-8-29 08:57:53 |只看作者 |坛友微信交流群
谢谢分享,如果可以附上原文地址就更好了~~~

使用道具

7
casey_c 发表于 2017-8-30 10:26:44 |只看作者 |坛友微信交流群
xiaoying3146 发表于 2017-8-29 08:57
谢谢分享,如果可以附上原文地址就更好了~~~
是从数析学院网站搬运的,不好直接给链接,直接搜索数析学院或者“Scikit-Learn 决策树与随机森林”都可以找到原文

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 13:43