diff --git a/README.md b/README.md index efdea63..a54080b 100644 --- a/README.md +++ b/README.md @@ -61,8 +61,12 @@ uv run streamlit run src/streamlit_app.py | 样本量 | 5,572 条 | | 特征数 | 1 个(短信文本) | +### 1.3 批量分析测试数据 -### 1.3 数据切分与防泄漏 +项目中提供了 [email_data.csv](file:///d:/sms-castle-walls/email_data.csv) 文件,该数据集包含多条中英文测试短信。该数据集可以用于系统的**批量文件分析处理**功能,验证系统对批量文件的自动化分析能力。 + + +### 1.4 数据切分与防泄漏 数据按 8:2 比例分割为训练集和测试集,确保模型在独立的测试集上进行评估。在数据预处理和特征工程阶段,所有操作仅在训练集上进行,避免信息泄漏到测试集。使用 TF-IDF 进行文本向量化时,同样严格遵循先训练后应用的原则。 @@ -190,7 +194,14 @@ Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. Text FA to 8 ``` -## 4️⃣ 开发心得 +## 4️⃣ 系统特色 + +### 4.1 UI 界面风格 + +本系统的 Web 界面采用了独特的**欧洲中世纪风格**(Medieval Style)。通过精心设计的 CSS 样式,界面融合了深色古堡背景、金色边框以及复古的衬线字体,旨在为用户提供一种“在城堡中审阅密信”的沉浸式操作体验。 + + +## 5️⃣ 开发心得 ### 4.1 主要困难与解决方案