本文主要讲述机器学习常用的评价指标,如精准率、召回率、精准度、P-R曲线,TPR、FPR、ROC、AUC等指标。
在机器学习分类当中,最为基础的应该就是混淆矩阵。
精确率:
Precision(也叫查准率)
其公式为:(TP)/(TP+FP)
在所有预测为正的结果中,预测正确的比例
召回率:
Recall、也叫查全率
其公式为:(TP)/(TP+FN)
在所有真实为正的样例中,被预测为正例的比例
P-R曲线:
定义:根据预测结果将预测样本排序,最有可能为正样本的在前,最不可能的在后,依次将样本预测为正样本,分别计算当前的精准率和召回率,绘制P-R曲线
F1值:
公式:(2PR)/(P+R)
TPR:
真正例率,与召回率相同
公式:(TP)/(TR+FN)
FPR:
假正例率
公式:(FP)/(TN+FP)
ROC,受试者工作特征曲线
根据预测结果将预测样本排序,最有可能为正样本的在前,最不可能的在后,依次将样本预测为正样本,分别计算当前的TPR和FPR,绘制ROC曲线。
AUC:
ROC曲线下的面积