精确率,召回率

摘要:
它反映了由分类器R=TP/(TP+FN)判断的阳性样本中真实阳性样本的特定召回率,并反映了所有阳性样本中正确分类的阳性样本比例的准确率A=(TP+TN)/(P+N)=(TP+TN)/(TP+FN+FP+TN);是准确率和召回率的调和平均值1/F1=1/P+1/R,F1=2*A*R/(A+R)roc曲线的横坐标是fp_rate,纵坐标是tp_rate

精确率 P = TP/(TP+FP) ;  反映了被分类器判定的正例中真正的正例样本的比重

召回率 R = TP/(TP+FN),反映了被正确分类的正样本占所有正样本的比例 

准确率(Accuracy)
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN);    

反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负 

F1值,是精确率与召回率的调和均值

1/F1 = 1/P + 1/R ,

F1 = 2*A*R/(A+R)

roc曲线的横坐标是fp_rate,纵坐标是tp_rate。

fp_rate=fp/(fp+tn)

tp_rate=tp/(tp+fn)

求auc的时候可以计算roc曲线下面的面积,取多个阈值去计算fp_rate和tp_rate描点绘制roc曲线,然后计算面积。

免责声明:文章转载自《精确率,召回率》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇SQL的连接(外连接、内连接、交叉连接和自连接)mui 选项卡下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

iOS UIBezierPath简单实用

 转载请注明出处!!! 1.介绍       UIBezierPath这个类在UIKit中, 是Core Graphics框架关于path的一个封装,使用此类可以定义简单的形状,比如我们常用到,矩形,圆形,椭圆,弧,或者不规则的多边形      每一个直线段或者曲线段的结束的地方是下一个的开始的地方。每一个连接的直线或者曲线段的集合成为subpath。一...

机器学习:决策树(二)——sklearn决策树调参

参数解析 参数 DecisionTreeClassifier DecisionTreeRegressor 特征选择标准criterion 可以使用"gini"或者"entropy",前者代表基尼系数,后者代表信息增益。一般说使用默认的基尼系数"gini"就可以了,即CART算法。除非你更喜欢类似ID3, C4.5的最优特征选择方法。 可以使用"m...

【机器学习】聚类分析的模型评估

  一、聚类算法中的距离   1. 单个样本之间的距离        余弦距离        在聚类分析中,一般需要对数据进行标准化,因为聚类数据会受数据量纲的影响。   在sklearn库中,可调用如下方法进行标准化: 1 from sklearn.preprocessing import StandardScaler 2 data = Standard...

精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?

ROC(receiver operating characteristic curve)是曲线。也就是下图中的曲线。同时我们也看里面也上了AUC也就是是面积。一般来说,如果ROC是光滑的,那么基本可以判断没有太大的overfitting(比如图中0.2到0.4可能就有问题,但是样本太少了),这个时候调模型可以只看AUC,面积越大一般认为模型越好。 再说...

数据不平衡的相关

数据不平衡的数据处理 1. 前言 什么是不平衡数据呢?顾名思义即我们的数据集样本类别比例不均衡。数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。     1.1 数据不平衡例子...

大数据技术之_19_Spark学习_08_Spark 机器学习_01_机器学习概述 + 机器学习的相关概念 + 算法常用指标

第1章 机器学习概述1.1 机器学习是啥?1.2 机器学习能干啥?1.3 机器学习有啥?1.4 机器学习怎么用?第2章 机器学习的相关概念2.1 数据集2.2 泛化能力2.3 过拟合和欠拟合2.4 维度、特征2.5 模型2.6 学习第3章 算法常用指标3.1 精确率和召回率3.2 TPR、FPR & TNR3.3 综合评价指标 F-measure...