楼主: tuzhiyoyo
1650 5

[统计软件与数据分析] 求助关于机器学习中分类器性能检验(或模型评估)的指标疑惑 [推广有奖]

  • 0关注
  • 0粉丝

高中生

87%

还不是VIP/贵宾

-

威望
0
论坛币
3974 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
62 点
帖子
6
精华
0
在线时间
68 小时
注册时间
2016-2-19
最后登录
2021-1-26

楼主
tuzhiyoyo 发表于 2018-11-28 22:42:25 |AI写论文
200论坛币
       大家好,我目前在用一批土壤数据做二分类模型,尝试了随机森林、SVM、逻辑斯蒂回归、朴素贝叶斯等常用分类算法,但是结果不太理想。不理想指的是采用常规的ROC曲线法进行模型精度验证时,曲线基本就在0.5随机线附近,AUC也就0.53左右的样子。
       之前看到过一篇关于贝叶斯概率预测模型的文章(Wu Bo, 2018),他在检验模型准确性时没有采取ROC曲线法或类似基于混淆矩阵的方法,而是把验证数据集当作一个整体,计算了两个分类各自的频率,然后将验证数据集参数的平均值带入训练好的贝叶斯模型,求出一个后验概率,通过比较后验概率与实际频率,来说明模型的好坏。
       于是尝试用这种思路,去把我的验证数据集每个样本带入模型计算得到的那个数字(例如贝叶斯和逻辑斯蒂回归都可以给出后验概率)求平均,发现这个平均数确实和实际两个类别的频率很接近。我又通过改变数据的分类阈值(比如说原来是170cm以上算高个,现在调整成160就是高个儿),发现不同阈值下求得的这个平均数和相应的实际频率都很一致。
       本人数学底子挺差的,不知道这种验证方法是否可行?如果可行的话,后面是什么原理?能否指点个参考文献?如果不行的话,又是为什么呢?

关键词:逻辑斯蒂回归 概率预测模型 后验概率 逻辑斯蒂 实际频率

沙发
70044684 发表于 2018-11-29 08:43:20
这是建模思路

藤椅
70044684 发表于 2018-11-29 08:58:50
收到请多少给点币,我想下载点东西,没有币

板凳
kokomi_forever 发表于 2018-11-29 09:05:00
能把论文全称贴出来吗,没用公式的描述看的很吃力

报纸
tuzhiyoyo 发表于 2018-11-29 10:21:16
70044684 发表于 2018-11-29 08:43
这是建模思路
您好,感谢您回复,您说的建模思路意思是?

地板
tuzhiyoyo 发表于 2018-11-29 10:25:23
kokomi_forever 发表于 2018-11-29 09:05
能把论文全称贴出来吗,没用公式的描述看的很吃力
您好,论文名字是Risk forewarning model for rice grain Cd pollution based on Bayes theory

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 03:49