逻辑回归
就是把线性回归(连续数值)通过Sigmoid函数映射成0-1区间,用作概率类
混淆矩阵: 分类结果的TP、FP、TN、FN 统计表格
混淆矩阵
| 真实结果 \ 预测结果 | 正例 | 假例 |
|---|---|---|
| 正例 | 真正例 TP | 伪反例 FN |
| 假例 | 伪正例 FP | 真反例 TN |
精确率:预测为正比例中实际正例的比例

召回率:实际正例中被正确预测的比例

F1-score:精确率和召回率的调和平均数

ROC曲线:不同阈值下TPR 与 FPR的关系曲线
横轴:假正例率(FPR)

纵轴:真正例率(TPR)

AUC指标:ROC曲线下的面积,衡量模型泛化能力
- AUC=1:模型完美分类
- AUC=0.5:模型=随机猜测
- AUC<0.5:模型性能差于随机猜测
表解释
| 评估指标 | 最佳值 | 说明 |
| 精确率 (Precision) | ↑ 越大越好 | 预测为正例中实际正例的比例,值越高表示误判越少。 |
| 召回率 (Recall) | ↑ 越大越好 | 实际正例中被正确预测的比例,值越高表示漏检越少。 |
| F1-score | ↑ 越大越好 | 精确率和召回率的调和平均,平衡两者的综合指标。 |
| AUC | ↑ 越大越好 | ROC 曲线下面积,衡量模型泛化能力,1 为完美分类,0.5 相当于随机猜测。 |
| TPR(真正例率) | ↑ 越大越好 | 即召回率,实际正例中被正确预测的比例。 |
| FPR(假正例率) | ↓ 越小越好 | 实际负例中被误判为正例的比例,值越低表示误判越少。 |
| ROC 曲线 | 左上角集中 | 曲线越靠近左上角(AUC 越接近 1),模型性能越好。 |
| 混淆矩阵 | - | 理想情况:TP 和 TN 越大越好,FP 和 FN 越小越好。 |