逻辑回归

逻辑回归

就是把线性回归(连续数值)通过Sigmoid函数映射成0-1区间,用作概率类

混淆矩阵: 分类结果的TP、FP、TN、FN 统计表格

混淆矩阵

真实结果 \ 预测结果正例假例
正例真正例 TP伪反例 FN
假例伪正例 FP真反例 TN

精确率:预测为正比例中实际正例的比例

召回率:实际正例中被正确预测的比例

F1-score:精确率和召回率的调和平均数

ROC曲线:不同阈值下TPR 与 FPR的关系曲线

横轴:假正例率(FPR

纵轴:真正例率(TPR

AUC指标:ROC曲线下的面积,衡量模型泛化能力

  • AUC=1:模型完美分类
  • AUC=0.5:模型=随机猜测
  • AUC<0.5:模型性能差于随机猜测

表解释

评估指标最佳值说明
精确率 (Precision)↑ 越大越好预测为正例实际正例的比例,值越高表示误判越少
召回率 (Recall)↑ 越大越好实际正例被正确预测的比例,值越高表示漏检越少
F1-score↑ 越大越好精确率召回率调和平均,平衡两者的综合指标。
AUC↑ 越大越好ROC 曲线下面积,衡量模型泛化能力,1 为完美分类0.5 相当于随机猜测
TPR(真正例率)↑ 越大越好即召回率,实际正例被正确预测比例
FPR(假正例率)↓ 越小越好实际负例被误判为正例的比例,值越低表示误判越少
ROC 曲线左上角集中曲线越靠近左上角(AUC 越接近 1),模型性能越好。
混淆矩阵-理想情况:TP 和 TN 越大越好,FP 和 FN 越小越好。