From 498391c4ff7622c249d3e0b2ffc72dd8db503c5a Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E8=90=A7?= Date: Thu, 15 Jan 2026 15:40:50 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E6=9B=B4=E6=96=B0README=E4=B8=AD?= =?UTF-8?q?=E7=9A=84=E6=A8=A1=E5=9E=8B=E6=80=A7=E8=83=BD=E5=AF=B9=E6=AF=94?= =?UTF-8?q?=E5=88=86=E6=9E=90?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 添加了Logistic Regression和LightGBM模型的详细性能对比,包括混淆矩阵数据和对比分析 --- README.md | 38 +++++++++++++++++++++++++++++++++++++- 1 file changed, 37 insertions(+), 1 deletion(-) diff --git a/README.md b/README.md index 29e2a9b..683293f 100644 --- a/README.md +++ b/README.md @@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py | LightGBM | F1 分数(Macro) | 0.971 | -### 2.3 误差分析 +### 2.3 模型性能对比 + + +#### 混淆矩阵对比 + +下面是两个模型在测试集上的混淆矩阵对比: + +**Logistic Regression 混淆矩阵** + +![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png) + +**LightGBM 混淆矩阵** + +![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png) + + +#### 对比分析 + +1. **Logistic Regression**: + - 真阳性(TP):136(正确分类的垃圾短信) + - 真阴性(TN):957(正确分类的正常短信) + - 假阳性(FP):12(正常短信被误判为垃圾短信) + - 假阴性(FN):9(垃圾短信被误判为正常短信) + +2. **LightGBM**: + - 真阳性(TP):129(正确分类的垃圾短信) + - 真阴性(TN):960(正确分类的正常短信) + - 假阳性(FP):9(正常短信被误判为垃圾短信) + - 假阴性(FN):16(垃圾短信被误判为正常短信) + +3. **性能差异**: + - LightGBM 在正常短信的分类上表现略好(TN 更高,FP 更低) + - Logistic Regression 在垃圾短信的分类上表现略好(TP 更高,FN 更低) + - 整体而言,两个模型的性能都非常优秀,准确率都在 97% 以上 + + +### 2.4 误差分析 模型在以下类型的样本上表现相对较差: