From 498391c4ff7622c249d3e0b2ffc72dd8db503c5a Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E8=90=A7?= <a17754937319@163.com>
Date: Thu, 15 Jan 2026 15:40:50 +0800
Subject: [PATCH] =?UTF-8?q?docs:=20=E6=9B=B4=E6=96=B0README=E4=B8=AD?=
 =?UTF-8?q?=E7=9A=84=E6=A8=A1=E5=9E=8B=E6=80=A7=E8=83=BD=E5=AF=B9=E6=AF=94?=
 =?UTF-8?q?=E5=88=86=E6=9E=90?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

添加了Logistic Regression和LightGBM模型的详细性能对比，包括混淆矩阵数据和对比分析
---
 README.md | 38 +++++++++++++++++++++++++++++++++++++-
 1 file changed, 37 insertions(+), 1 deletion(-)

diff --git a/README.md b/README.md
index 29e2a9b..683293f 100644
--- a/README.md
+++ b/README.md
@@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py
 | LightGBM | F1 分数（Macro） | 0.971 |
 
 
-### 2.3 误差分析
+### 2.3 模型性能对比
+
+
+#### 混淆矩阵对比
+
+下面是两个模型在测试集上的混淆矩阵对比：
+
+**Logistic Regression 混淆矩阵**
+
+![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png)
+
+**LightGBM 混淆矩阵**
+
+![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png)
+
+
+#### 对比分析
+
+1. **Logistic Regression**：
+   - 真阳性（TP）：136（正确分类的垃圾短信）
+   - 真阴性（TN）：957（正确分类的正常短信）
+   - 假阳性（FP）：12（正常短信被误判为垃圾短信）
+   - 假阴性（FN）：9（垃圾短信被误判为正常短信）
+
+2. **LightGBM**：
+   - 真阳性（TP）：129（正确分类的垃圾短信）
+   - 真阴性（TN）：960（正确分类的正常短信）
+   - 假阳性（FP）：9（正常短信被误判为垃圾短信）
+   - 假阴性（FN）：16（垃圾短信被误判为正常短信）
+
+3. **性能差异**：
+   - LightGBM 在正常短信的分类上表现略好（TN 更高，FP 更低）
+   - Logistic Regression 在垃圾短信的分类上表现略好（TP 更高，FN 更低）
+   - 整体而言，两个模型的性能都非常优秀，准确率都在 97% 以上
+
+
+### 2.4 误差分析
 
 
 模型在以下类型的样本上表现相对较差：