楼主: dbcoffee
1061 4

[问答] 建立预测模型时,如何进行K折交叉验证? [推广有奖]

  • 0关注
  • 0粉丝

已卖:86份资源

硕士生

51%

还不是VIP/贵宾

-

威望
0
论坛币
181 个
通用积分
170.9881
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
1159 点
帖子
62
精华
0
在线时间
211 小时
注册时间
2015-6-16
最后登录
2022-7-10

楼主
dbcoffee 发表于 2021-9-25 21:39:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
交叉验证基本思路已经学会了,但是我有个问题,在交叉验证前,模型的建立是用的原始数据吗?交叉验证是不是也是在原始数据的基础上?

比如,我的数据集为mydata,根据统计学与实际情况,筛选变量,通过mydata(不拆分训练集和验证集)建立logistic模型,然后再用原始的mydata和刚才拟合的logistic模型进行K折交叉验证?

求指点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:交叉验证 预测模型 Logistic模型 logistic logisti

沙发
s609078902 发表于 2021-9-26 10:51:31
交叉验证是吧数据分成三部分:训练集、验证集和测试集,使用训练集和验证集进行交叉验证

藤椅
dbcoffee 发表于 2021-9-26 16:18:04
s609078902 发表于 2021-9-26 10:51
交叉验证是吧数据分成三部分:训练集、验证集和测试集,使用训练集和验证集进行交叉验证
那是不是就是说将原始数据分为三份,一份是训练集,一份是验证集,一份是测试集,使用训练集建立模型,使用验证集进行交叉验证(评价模型的泛化性),最后使用测试集测试(评价模型的准确性、区分度等)?

如果是分为三份,分配的原则是什么?均分?我看交叉验证时不是说应该所有数据都利用上了吗?另外,交叉验证不是针对小样本数据效果比较理想吗?如果是小样本数据,原始数据分为三份后,每一份的数据量不是更小了吗?

问的有点多,因为正迷糊着呢,见谅

板凳
万人往LVR 在职认证  发表于 2021-9-26 17:50:00

报纸
s609078902 发表于 2021-9-27 15:07:51
dbcoffee 发表于 2021-9-26 16:18
那是不是就是说将原始数据分为三份,一份是训练集,一份是验证集,一份是测试集,使用训练集建立模型,使 ...
1. 先把全部数据 7:3 分成大训练集和测试集,
2. 再将大训练集 8:2 分成小训练集和验证集,
3. 使用小训练集和验证集进行交叉验证,选择最优超参数,
4. 然后使用最优超参数和大训练集训练最终模型,
5. 使用测试集评估泛化能力

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 19:52