docs: 更新README文档内容

添加批量分析测试数据说明和系统特色章节,包括UI界面风格描述
This commit is contained in:
无敌霸王龙 2026-01-15 22:04:18 +08:00
parent 6959951dd0
commit da57a3b7bd

View File

@ -61,8 +61,12 @@ uv run streamlit run src/streamlit_app.py
| 样本量 | 5,572 条 |
| 特征数 | 1 个(短信文本) |
### 1.3 批量分析测试数据
### 1.3 数据切分与防泄漏
项目中提供了 [email_data.csv](file:///d:/sms-castle-walls/email_data.csv) 文件,该数据集包含多条中英文测试短信。该数据集可以用于系统的**批量文件分析处理**功能,验证系统对批量文件的自动化分析能力。
### 1.4 数据切分与防泄漏
数据按 8:2 比例分割为训练集和测试集,确保模型在独立的测试集上进行评估。在数据预处理和特征工程阶段,所有操作仅在训练集上进行,避免信息泄漏到测试集。使用 TF-IDF 进行文本向量化时,同样严格遵循先训练后应用的原则。
@ -190,7 +194,14 @@ Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. Text FA to 8
```
## 4⃣ 开发心得
## 4⃣ 系统特色
### 4.1 UI 界面风格
本系统的 Web 界面采用了独特的**欧洲中世纪风格**Medieval Style。通过精心设计的 CSS 样式,界面融合了深色古堡背景、金色边框以及复古的衬线字体,旨在为用户提供一种“在城堡中审阅密信”的沉浸式操作体验。
## 5⃣ 开发心得
### 4.1 主要困难与解决方案