diff --git a/README.md b/README.md
index 29e2a9b..683293f 100644
--- a/README.md
+++ b/README.md
@@ -89,7 +89,43 @@ uv run streamlit run src/streamlit_app.py
 | LightGBM | F1 分数（Macro） | 0.971 |
 
 
-### 2.3 误差分析
+### 2.3 模型性能对比
+
+
+#### 混淆矩阵对比
+
+下面是两个模型在测试集上的混淆矩阵对比：
+
+**Logistic Regression 混淆矩阵**
+
+![Logistic Regression Confusion Matrix](./models/logistic_regression_confusion_matrix.png)
+
+**LightGBM 混淆矩阵**
+
+![LightGBM Confusion Matrix](./models/lightgbm_confusion_matrix.png)
+
+
+#### 对比分析
+
+1. **Logistic Regression**：
+   - 真阳性（TP）：136（正确分类的垃圾短信）
+   - 真阴性（TN）：957（正确分类的正常短信）
+   - 假阳性（FP）：12（正常短信被误判为垃圾短信）
+   - 假阴性（FN）：9（垃圾短信被误判为正常短信）
+
+2. **LightGBM**：
+   - 真阳性（TP）：129（正确分类的垃圾短信）
+   - 真阴性（TN）：960（正确分类的正常短信）
+   - 假阳性（FP）：9（正常短信被误判为垃圾短信）
+   - 假阴性（FN）：16（垃圾短信被误判为正常短信）
+
+3. **性能差异**：
+   - LightGBM 在正常短信的分类上表现略好（TN 更高，FP 更低）
+   - Logistic Regression 在垃圾短信的分类上表现略好（TP 更高，FN 更低）
+   - 整体而言，两个模型的性能都非常优秀，准确率都在 97% 以上
+
+
+### 2.4 误差分析
 
 
 模型在以下类型的样本上表现相对较差：