docs: 更新README中的模型性能对比分析

添加了Logistic Regression和LightGBM模型的详细性能对比,包括混淆矩阵数据和对比分析
This commit is contained in:
2026-01-15 15:40:50 +08:00
parent 73490e6799
commit 498391c4ff

View File

@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py
| LightGBM | F1 分数Macro | 0.971 | | LightGBM | F1 分数Macro | 0.971 |
### 2.3 误差分析 ### 2.3 模型性能对比
#### 混淆矩阵对比
下面是两个模型在测试集上的混淆矩阵对比:
**Logistic Regression 混淆矩阵**
![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png)
**LightGBM 混淆矩阵**
![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png)
#### 对比分析
1. **Logistic Regression**
- 真阳性TP136正确分类的垃圾短信
- 真阴性TN957正确分类的正常短信
- 假阳性FP12正常短信被误判为垃圾短信
- 假阴性FN9垃圾短信被误判为正常短信
2. **LightGBM**
- 真阳性TP129正确分类的垃圾短信
- 真阴性TN960正确分类的正常短信
- 假阳性FP9正常短信被误判为垃圾短信
- 假阴性FN16垃圾短信被误判为正常短信
3. **性能差异**
- LightGBM 在正常短信的分类上表现略好TN 更高FP 更低)
- Logistic Regression 在垃圾短信的分类上表现略好TP 更高FN 更低)
- 整体而言,两个模型的性能都非常优秀,准确率都在 97% 以上
### 2.4 误差分析
模型在以下类型的样本上表现相对较差: 模型在以下类型的样本上表现相对较差: