人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛 › 模型验证与参数调整

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

返回列表

发帖

楼主: casey_c

1563 1

[程序分享] 模型验证与参数调整 [推广有奖]

0关注
10粉丝

博士生

92%

还不是VIP/贵宾

威望: 0 级
论坛币: 96 个
通用积分: 2.0091
学术水平: 2 点
热心指数: 15 点
信用等级: 2 点
经验: 11502 点
帖子: 278
精华: 0
在线时间: 94 小时
注册时间: 2016-11-22
最后登录: 2022-5-2

楼主

casey_c 发表于 2017-6-9 11:56:10 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

以下内容转自数析学院，只节选了部分，有需要的同学可以直接查看原文

继续基于 Scikit-Learn 库的相关模块，向大家介绍 Python 中一些模型验证及调优的工具。
为了方便后续的演示，首先导入示例数据集 iris，并对数据特征与标记（即模型的自变量与因变量）进行提取划分：

from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target

复制代码

构建一个 KNN 分类模型 model，用于验证准备：

from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier(n_neighbors=1)

复制代码

模型拟合与预测：

model.fit(X, y)
y_model = model.predict(X)

复制代码

导入 metrics 模块的 accuracy_score 函数，该函数能够帮助我们计算模型的准确率：

from sklearn.metrics import accuracy_score
accuracy_score(y, y_model)

复制代码

1.0
交叉验证是机器学习中常用的模型验证方法，这需要我们将数据集划分为训练集与验证集，cross_validation 模块中的 train_test_split 函数能够帮助我们实现较轻松的划分：

from sklearn.cross_validation import train_test_split
# 对数据集进行划分，一半作为训练集，另一半作为验证集
X1, X2, y1, y2 = train_test_split(X, y, random_state=0,
train_size=0.5)
# 运用训练集拟合模型
model.fit(X1, y1)
# 运用验证集评价模型准确度
y2_model = model.predict(X2)
accuracy_score(y2, y2_model)

复制代码

0.90666666666666662
后文还有介绍 k-fold 交叉验证的工具 cross_val_score 、模型参数调优、绘制模型拟合的曲线等，内容较多，先搬运到这，有需要的同学可以先直接到数析学院查看原文

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：模型验证 scikit-learn classifier Validation accuracy 模型

[程序分享] 模型验证与参数调整 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[程序分享] 模型验证与参数调整 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群