楼主: 5761_1596338429
425 1

[学习笔记] 【学习笔记】# 先来确定一个字典 # 这个字典保存就是所有参数大致的一个最优的 ... [推广有奖]

  • 0关注
  • 0粉丝

本科生

12%

还不是VIP/贵宾

-

威望
0
论坛币
906 个
通用积分
21.3478
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
330 点
帖子
63
精华
0
在线时间
0 小时
注册时间
2020-8-2
最后登录
2020-10-14

楼主
5761_1596338429 发表于 2020-9-17 22:40:22 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
# 先来确定一个字典
# 这个字典保存就是所有参数大致的一个最优的范围

Xtrain, Xtest, Ytrain, Ytest = train_test_split(X, Y, test_size = 0.3, random_state = 41)

params = {
    \'max_depth\' : [2,3,4,5,6,7],
    \'min_samples_leaf\' : [6,7,8,9],
    \'min_impurity_decrease\' : [0, 0.005,0.01,0.015,0.02]
}

# 导入sklearn明星之一
from sklearn.model_selection import GridSearchCV

# 实例化决策树模型
model =  DecisionTreeClassifier()

# 构建网格搜索对象
gs_model = GridSearchCV(model, params, cv = 5, scoring = \'accuracy\')

# 非常重要一点
# gs_model继承了所有的model的功能,放进去决策树模型,gs_model继承了它, gs_model也是一个决策树模型
# 不仅仅gs_model是一个决策树模型,而且它在训练的过程中,会自动通过交叉验证去找最优的参数
gs_model.fit(Xtrain, Ytrain)

# 数据量很少,所以训练的特别快
# 可以将最优的参数拿出来
print(gs_model.best_params_)

# 具体最优参数下交叉验证的精准度是多少了
print(gs_model.best_score_)

# 最好的参数已经找到了,其实对于gs_model来说,它就是一个决策树,最优的参数已经保存到了gs_model
gs_model.score(Xtrain, Ytrain), gs_model.score(Xtest, Ytest)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 习笔记 classifier Selection decrease

沙发
512661101 发表于 2020-9-18 11:36:22 来自手机 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-11 02:44