楼主: kejiayuan0806
1341 6

[学习笔记] 【学习笔记】常用的模型评价指标 [推广有奖]

  • 0关注
  • 0粉丝

教师

硕士生

50%

还不是VIP/贵宾

-

威望
0
论坛币
26597 个
通用积分
16.9233
学术水平
9 点
热心指数
9 点
信用等级
8 点
经验
2260 点
帖子
90
精华
0
在线时间
116 小时
注册时间
2018-2-22
最后登录
2025-10-11

楼主
kejiayuan0806 在职认证  发表于 2019-4-19 16:47:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
分类模型评价指标:精确率、正确率、召回率、F值、ROC、AUC等指标。

精确率(precision)是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本,也就是precision=TP/(TP+FP)。

而召回率(recall)是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了,也就是recall=TP/(TP+FN)。

一个分母是预测为正的样本数,另一个是原来样本中所有的正样本数。

准确率(accuracy)是预测对的数量占所有样本的比例,也就是accuracy= (TP+TN)/(TP+FN+FP+TN)。

F值是精确率和召回率的调和平均值,精确率和召回率都高的情况下,F值也会高。也就是2/F=1/P+1/R,即F=P*R/2(P+R)=2TP/(2TP+FP+FN)。

评估一个分类器的好坏可以设一个阈值,大于这个值的为正类,小于这个值为负类。如果我们减小这个阀值,那么更多的样本会被识别为正类。这会提高正类的识别率,但同时也会使得更多的负类被错误识别为正类。为了形象化这一变化,在此引入 ROC,ROC 关注两个指标:true positive rate:TPR=TP/(TP+FN),false positive rate:FPR=FP/(FP+TN)。TPR 代表能将正例分对的概率,FPR 代表将负例错分为正例的概率。在 ROC 空间中,每个点的横坐标是 FPR,纵坐标是 TPR,这也就描绘了分类器在 TP(真正率)和 FP(假正率)间的 trade-off2。

AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。随机挑选一个正样本以及一个负样本,分类器判定正样本的值高于负样本的概率就是 AUC 值。AUC值越大的分类器,正确率越高。

既然已经有那么多的评价指标,为什么还要使用ROC和AUC呢?

因为ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡现象,即负样本比正样本多很多或者少很多。

回归模型的评价指标:平均绝对误差、平均平方误差。

平均绝对误差MAE(Mean Absolute Error)又被称为 l1 范数损失:

平均平方误差MSE(Mean Squared Error)又被称为 l2范数损失:


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:平均绝对误差MAE 平均绝对误差 模型评价指标 评价指标 绝对误差

已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
zhdefei + 1 精彩帖子
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 4  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
经管之家编辑部 在职认证  发表于 2019-4-19 16:57:45
为您点赞!

藤椅
珍惜点滴 学生认证  发表于 2019-4-19 16:59:49
感谢分享,向您学习,赞!

板凳
充实每一天 发表于 2019-4-19 18:04:03 来自手机
点赞

报纸
从1万到一亿 在职认证  发表于 2019-4-19 21:10:26

地板
胡明敏 发表于 2019-5-4 20:00:44
谢谢分享

7
tianwk 发表于 2019-8-6 14:56:35
thanks for sharing

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-28 14:14