人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛 › Scikit-Learn 决策树与随机森林

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

返回列表

发帖

楼主: casey_c

1851 6

[程序分享] Scikit-Learn 决策树与随机森林 [推广有奖]

0关注
10粉丝

博士生

92%

还不是VIP/贵宾

威望: 0 级
论坛币: 96 个
通用积分: 2.0091
学术水平: 2 点
热心指数: 15 点
信用等级: 2 点
经验: 11502 点
帖子: 278
精华: 0
在线时间: 94 小时
注册时间: 2016-11-22
最后登录: 2022-5-2

楼主

casey_c 发表于 2017-6-27 16:38:03 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

向大家介绍在 Python 中利用 Scikit-Learn 工具库进行决策树分类器与随机森林模型建模的相关方法。

首先导入相关的的可视化工具：

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()

复制代码

运用 make_blobs 生成本节示例数据，300 个随机样本分为四个类型，如下图所示：

from sklearn.datasets import make_blobs
X, y = make_blobs(n_samples=300, centers=4,
random_state=0, cluster_std=1.0)
plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='rainbow');

复制代码

接下来，我们导入 Scikit-Learn 中的 DecisionTreeClassifier 工具，构建并训练一个决策树分类器：

from sklearn.tree import DecisionTreeClassifier
tree = DecisionTreeClassifier().fit(X, y)

复制代码

为了直观地呈现模型效果，构建如下函数 visualize_classifier ：

def visualize_classifier(model, X, y, ax=None, cmap='rainbow'):
ax = ax or plt.gca()
# 绘制用于训练的样本点
ax.scatter(X[:, 0], X[:, 1], c=y, s=30, cmap=cmap,
clim=(y.min(), y.max()), zorder=3)
ax.axis('tight')
ax.axis('off')
xlim = ax.get_xlim()
ylim = ax.get_ylim()
# 拟合估计值
model.fit(X, y)
xx, yy = np.meshgrid(np.linspace(*xlim, num=200),
np.linspace(*ylim, num=200))
Z = model.predict(np.c_[xx.ravel(), yy.ravel()]).reshape(xx.shape)
# 根据估计结果绘制彩色区块
n_classes = len(np.unique(y))
contours = ax.contourf(xx, yy, Z, alpha=0.3,
levels=np.arange(n_classes + 1) - 0.5,
cmap=cmap, clim=(y.min(), y.max()),
zorder=1)
ax.set(xlim=xlim, ylim=ylim)

复制代码

可以看到，我们训练的分类器模型以图中的色块区域将样本点划分为了不同的类型：

visualize_classifier(DecisionTreeClassifier(), X, y)

复制代码

以上内容节选自数析学院，后文还有介绍其他分类工具以及数字识别实例等，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏4 回帖

关键词：scikit-learn Learn 随机森林 Earn SCI

相关帖子

已有 1 人评分	经验	收起理由
残阳_等待	+ 60	精彩帖子

总评分: 经验 + 60 查看全部评分

使用道具举报

沙发

casey_c 发表于 2017-6-30 16:44:08 |只看作者 |坛友微信交流群

使用道具举报

藤椅

残阳_等待 发表于 2017-7-1 09:49:24 |只看作者 |坛友微信交流群

感谢分享好资源！

使用道具举报

板凳

ydc129 发表于 2017-7-3 00:39:36 |只看作者 |坛友微信交流群

谢谢分享

使用道具举报

报纸

casey_c 发表于 2017-7-4 10:31:10 |只看作者 |坛友微信交流群

使用道具举报

地板

xiaoying3146 发表于 2017-8-29 08:57:53 |只看作者 |坛友微信交流群

谢谢分享，如果可以附上原文地址就更好了~~~

使用道具举报

7楼

casey_c 发表于 2017-8-30 10:26:44 |只看作者 |坛友微信交流群

xiaoying3146 发表于 2017-8-29 08:57
谢谢分享，如果可以附上原文地址就更好了~~~

是从数析学院网站搬运的，不好直接给链接，直接搜索数析学院或者“Scikit-Learn 决策树与随机森林”都可以找到原文

使用道具举报

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

手机版 |

意见反馈 |

帮助 |

新手入门 |

用户手册 |

友情链接 |

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[程序分享] Scikit-Learn 决策树与随机森林 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

初级学术勋章

初级热心勋章

本版微信群

[程序分享] Scikit-Learn 决策树与随机森林 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

初级学术勋章

初级热心勋章

本版微信群

扫码加我拉你入群