博客
关于我
准确率评价指标
阅读量:258 次
发布时间:2019-03-01

本文共 1013 字,大约阅读时间需要 3 分钟。

一、top1和top5

在分类任务中,top1和top5是两种常见的预测方式:

top1-即为预测的label取最后概率向量中最大的一个作为预测结果。如果正确分类,则预测正确;否则预测错误。

top5-则是最后概率向量中最大的前五名,只要包含正确的label即为预测正确;若正确label不在前五名,则预测错误。

二、Precision、Recall和Accuracy

2.1 Precision和Recall

在信息检索场景中,系统返回查询结果会出现以下几种情况:

1. **True Positive (TP)**:系统正确识别了用户需求的相关结果。

2. **False Positive (FP)**:系统误将无关结果归类为相关。

3. **False Negative (FN)**:系统漏掉了正确的相关结果。

4. **Gray Area**:系统识别出的结果本身就是无关内容。

precision(精确率)衡量系统返回的结果中有多少是正确的,即TP/(TP+FP)。Recall(召回率)则衡量系统返回的结果中有多少是相关的,即TP/(TP+FN)。两个指标相辅相成,单独提升一项可能导致另一项下降。

为什么不用准确率(accuracy)?因为准确率在样本不平衡时容易受到偏差。在大部分信息检索任务中,大部分结果都是无关的,使用准确率会导致结果失真。

2.2 为什么不用准确率(accuracy)

准确率的计算公式为:(TP + TN)/N,其中N为总样本数。虽然在平衡样本下准确率有用,但在实际应用中数据通常不平衡,导致准确率容易被误导。例如,在信息检索中,大部分结果无关,系统更倾向于优化召回率和精确率的平衡。

二、mAP(mean average precision)

在多标签分类任务中,mAP(mean average precision)是评估模型性能的常用指标。与单标签分类的accuracy不同,mAP考虑了多个标签的检测结果。

mAP的计算步骤如下:

1. 使用训练好的模型生成所有测试样本的confidence score,并记录每个样本的ground truth标签。

2. 按照confidence score对结果进行排序。

3. 计算每个类别的precision和recall,并取平均值。

mAP不仅考虑了每个样本的分类结果,还综合了所有类别的性能评估,适合多标签场景下的性能衡量。

转载地址:http://uctx.baihongyu.com/

你可能感兴趣的文章
Objective-C实现累加校验和(附完整源码)
查看>>
Objective-C实现红黑树算法(附完整源码)
查看>>
Objective-C实现约分(化简比)(附完整源码)
查看>>
Objective-C实现约瑟夫环(附完整源码)
查看>>
Objective-C实现约瑟夫环算法(附完整源码)
查看>>
Objective-C实现约瑟夫问题(附完整源码)
查看>>
Objective-C实现线性反馈移位寄存器LFSR(附完整源码)
查看>>
Objective-C实现线性查找算法(附完整源码)
查看>>
Objective-C实现线程安全的单例模式(附完整源码)
查看>>
Objective-C实现线程池(附完整源码)
查看>>
Objective-C实现组合模式(附完整源码)
查看>>
Objective-C实现绘制跳动的桃心(附完整源码)
查看>>
Objective-C实现给定一个 NxN 网格,找出单元格 [0, 0] 中的老鼠是否可以到达单元格 [N-1, N-1] 中的目标算法(附完整源码)
查看>>
Objective-C实现给定一个句子,返回出现次数最多的单词算法(附完整源码)
查看>>
Objective-C实现给定一个数字数组,返回最大乘积数组中的 3 个数字算法(附完整源码)
查看>>
Objective-C实现给定一个整数 n,将最小步数返回到 1算法(附完整源码)
查看>>
Objective-C实现给定一串字符,返回出现频率最高的字符算法(附完整源码)
查看>>
Objective-C实现给定两个数字 n 和 k,使 k 数字的所有唯一组合从 1 到 n 并按排序顺序算法(附完整源码)
查看>>
Objective-C实现给定两个长度相同的字符串s1和s2,如果s2是s1的乱序字符串则返回真,否则返回假算法(附完整源码)
查看>>
Objective-C实现给定分隔符加入字符串列表算法(附完整源码)
查看>>