转 召回率Recall、精确度Precision、准确率Accuracy、虚警、漏 精确度和召回率

根据自己的知识总结的,定义应该肯定对了,在某些表述方面可能有错误的地方。
假设原始样本中有两类,其中:
1:总共有 P个类别为1的样本,假设类别1为正例。
2:总共有N个类别为0 的样本,假设类别0为负例。
经过分类后:
3:有 TP个类别为1 的样本被系统正确判定为类别1,FN 个类别为1的样本被系统误判定为类别 0,显然有P=TP+FN;
4:有 FP 个类别为0 的样本被系统误判断定为类别1,TN 个类别为0 的样本被系统正确判为类别0,显然有N=FP+TN;

那么:
精确度(Precision):
P = TP/(TP+FP) ;反映了被分类器判定的正例中真正的正例样本的比重(

准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP +TN);反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负
【转】召回率Recall、精确度Precision、准确率Accuracy、虚警、漏 精确度和召回率

召回率(Recall),也称为 True Positive Rate:
R = TP/(TP+FN) = 1 - FN/T;反映了被正确判定的正例占总的正例的比重

转移性(Specificity,不知道这个翻译对不对,这个指标用的也不多),也称为 TrueNegativeRate
S = TN/(TN + FP) = 1 – FP/N;明显的这个和召回率是对应的指标,只是用它在衡量类别0 的判定能力。

F-measure or balanced F-score
F = 2 * 召回率 * 准确率/(召回率+准确率);这就是传统上通常说的F1 measure,另外还有一些别的Fmeasure,可以参考下面的链接

上面这些介绍可以参考:
http://en.wikipedia.org/wiki/Precision_and_recall
同时,也可以看看:http://en.wikipedia.org/wiki/Accuracy_and_precision

为什么会有这么多指标呢?
这是因为模式分类和机器学习的需要。判断一个分类器对所用样本的分类能力或者在不同的应用场合时,需要有不同的指标。 当总共有个100个样本(P+N=100)时,假如只有一个正例(P=1),那么只考虑精确度的话,不需要进行任何模型的训练,直接将所有测试样本判为正例,那么A 能达到99%,非常高了,但这并没有反映出模型真正的能力。另外在统计信号分析中,对不同类的判断结果的错误的惩罚是不一样的。举例而言,雷达收到100个来袭导弹的信号,其中只有3个是真正的导弹信号,其余 97 个是敌方模拟的导弹信号。假如系统判断 98 个(97个模拟信号加一个真正的导弹信号)信号都是模拟信号,那么Accuracy=98%,很高了,剩下两个是导弹信号,被截掉,这时Recall=2/3=66.67%,Precision=2/2=100%,Precision也很高。但剩下的那颗导弹就会造成灾害。

因此在统计信号分析中,有另外两个指标来衡量分类器错误判断的后果:
漏警概率(MissingAlarm)
MA = FN/(TP + FN) = 1 – TP/T = 1 - R;反映有多少个正例被漏判了(我们这里就是真正的导弹信号被判断为模拟信号,可见MA此时为33.33%,太高了)


虚警概率(False Alarm)
FA = FP / (TP + FP) = 1 –P;反映被判为正例样本中,有多少个是负例。


统计信号分析中,希望上述的两个错误概率尽量小。而对分类器的总的惩罚旧是上面两种错误分别加上惩罚因子的和:COST = Cma *MA+ Cfa * FA。不同的场合、需要下,对不同的错误的惩罚也不一样的。像这里,我们自然希望对漏警的惩罚大,因此它的惩罚因子 Cma要大些。

个人观点:虽然上述指标之间可以互相转换,但在模式分类中,一般用-- P、R、A 三个指标,不用MA和FA。而且统计信号分析中,也很少看到用 R 的。如果有错误的地方,欢迎指出并改正

resource:http://hi.baidu.com/lwhptl/item/c2da5a3c098e4ac6382ffa5f

  

爱华网本文地址 » http://www.413yy.cn/a/25101016/298163.html

更多阅读

真三3.9D郭嘉如何出装、加点和游戏攻略 梦三国郭嘉出装

真三3.9D郭嘉如何出装、加点和游戏攻略——简介在三国演义中,郭嘉是一个非常重要也非常聪明的谋士。而在真三中,郭嘉同样是一个非常重要,并非常厉害的法师。郭嘉的成长值非常高,其作用和技能跟司马懿差不多。下面就说一说真三3.9D郭嘉如

批量授权、零售版和OEM的区别 oem授权书

批量授权、零售版和OEM的区别——简介批量授权、零售版和OEM的区别当涉及到购买许可证(license)的问题,相信许多人都有过迷茫。不知道一些相应的license的问题。而购买license的渠道很多,那么我们应该要购买哪些license呢?他们的区别又

人造鸡蛋、新鲜鸡蛋和真假土鸡蛋辨别法 如何辨别土鸡蛋

人造鸡蛋、新鲜鸡蛋和真假土鸡蛋辨别法——简介记得十五六岁时俺娘就开始灌输女人要“入得厨房,出得厅堂”之类的观念,并时常要我陪她逛菜市场,而我常常心不在焉的听她喋喋不休,选黄瓜你要摸摸有没有刺的;西红柿你要看皮的颜色;那个鸡你摸

交换机、集线器、路由器区别和使用 集线器 交换机 路由器

交换机、集线器、路由器区别和使用最近看到很多人在询问交换机、集线器、路由器是什么,功能如何,有何区别,笔者就这些问题简单的做些解答。首先说HUB,也就是集线器。它的作用可以简单的理解为将一些机器连接起来组成一个局域网。而交

声明:《转 召回率Recall、精确度Precision、准确率Accuracy、虚警、漏 精确度和召回率》为网友奋发向上分享!如侵犯到您的合法权益请联系我们删除