diff --git a/README.md b/README.md index 29e2a9b..683293f 100644 --- a/README.md +++ b/README.md @@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py | LightGBM | F1 分数(Macro) | 0.971 | -### 2.3 误差分析 +### 2.3 模型性能对比 + + +#### 混淆矩阵对比 + +下面是两个模型在测试集上的混淆矩阵对比: + +**Logistic Regression 混淆矩阵** + +![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png) + +**LightGBM 混淆矩阵** + +![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png) + + +#### 对比分析 + +1. **Logistic Regression**: + - 真阳性(TP):136(正确分类的垃圾短信) + - 真阴性(TN):957(正确分类的正常短信) + - 假阳性(FP):12(正常短信被误判为垃圾短信) + - 假阴性(FN):9(垃圾短信被误判为正常短信) + +2. **LightGBM**: + - 真阳性(TP):129(正确分类的垃圾短信) + - 真阴性(TN):960(正确分类的正常短信) + - 假阳性(FP):9(正常短信被误判为垃圾短信) + - 假阴性(FN):16(垃圾短信被误判为正常短信) + +3. **性能差异**: + - LightGBM 在正常短信的分类上表现略好(TN 更高,FP 更低) + - Logistic Regression 在垃圾短信的分类上表现略好(TP 更高,FN 更低) + - 整体而言,两个模型的性能都非常优秀,准确率都在 97% 以上 + + +### 2.4 误差分析 模型在以下类型的样本上表现相对较差: