docs: 更新README中的模型性能对比分析

添加了Logistic Regression和LightGBM模型的详细性能对比，包括混淆矩阵数据和对比分析
2026-01-15 15:40:50 +08:00 · 2026-01-15 15:40:50 +08:00 · 498391c4ff
commit 498391c4ff
parent 73490e6799
1 changed files with 37 additions and 1 deletions
--- a/README.md
+++ b/README.md
@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py
 | LightGBM | F1 分数（Macro） | 0.971 |
-### 2.3 误差分析
+### 2.3 模型性能对比
 #### 混淆矩阵对比
 下面是两个模型在测试集上的混淆矩阵对比：
 **Logistic Regression 混淆矩阵**
 ![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png)
 **LightGBM 混淆矩阵**
 ![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png)
 #### 对比分析
 1. **Logistic Regression**：
   - 真阳性（TP）：136（正确分类的垃圾短信）
   - 真阴性（TN）：957（正确分类的正常短信）
   - 假阳性（FP）：12（正常短信被误判为垃圾短信）
   - 假阴性（FN）：9（垃圾短信被误判为正常短信）
 2. **LightGBM**：
   - 真阳性（TP）：129（正确分类的垃圾短信）
   - 真阴性（TN）：960（正确分类的正常短信）
   - 假阳性（FP）：9（正常短信被误判为垃圾短信）
   - 假阴性（FN）：16（垃圾短信被误判为正常短信）
 3. **性能差异**：
   - LightGBM 在正常短信的分类上表现略好（TN 更高，FP 更低）
   - Logistic Regression 在垃圾短信的分类上表现略好（TP 更高，FN 更低）
   - 整体而言，两个模型的性能都非常优秀，准确率都在 97% 以上
 ### 2.4 误差分析
 模型在以下类型的样本上表现相对较差：