# 🧠 智能知识库问答系统 ## 简介 这是一个基于 Flask 的企业/课程智能问答系统,支持上传自有文档并进行精准问答,减少人工答疑成本。 **一句话介绍**:这个项目解决了企业和教育场景中大量重复性答疑的痛点,让用户上传文档后即可获得精准的 AI 问答服务。 ## 如何运行 1. **安装依赖**:`pip install -r requirements.txt` 2. **配置 Key**:复制 `.env.example` 为 `.env` 并填入 DeepSeek API Key 3. **启动**:`python app.py` 应用将在 `http://localhost:5000` 启动。 ## 功能列表 - [x] 文档上传与管理(支持 PDF、Word、TXT 格式) - [x] 智能问答(基于上传的文档内容) - [x] 对话历史保存 - [x] 响应式设计(支持桌面端和移动端) - [x] 数据持久化(SQLite 数据库) - [x] 错误处理和用户反馈 - [ ] 集成 LangChain 进行更强大的文档处理(待开发) - [ ] 使用 ChromaDB 建立向量数据库(待开发) - [ ] 支持更多文档格式(Excel、PPT 等)(待开发) - [ ] 添加文档预览功能(待开发) - [ ] 实现对话导出功能(待开发) - [ ] 添加用户认证和权限管理(待开发) ## 📖 使用指南 ### 1. 上传文档 - 点击左侧知识库面板的"📤 点击或拖拽上传文档"区域 - 选择要上传的文档(支持 PDF、Word、TXT 格式) - 系统会自动解析文档内容并建立知识库索引 ### 2. 提问 - 在右侧聊天输入框中输入问题 - 点击"发送"按钮或按 Enter 键提交问题 - 系统会基于上传的文档内容提供精准答案 - 答案会显示参考来源,包括文档名称和页码 ### 3. 管理文档 - 在知识库面板中查看所有已上传的文档 - 点击"🗑️ 删除"按钮可以删除不需要的文档 - 文档状态会显示处理进度(处理中/已完成) ### 4. 查看历史 - 所有问答记录会自动保存 - 刷新页面后会自动加载历史对话 - 可以随时查看之前的问答内容 ## 🎬 演示流程 ### 场景 1:课程答疑 1. **准备阶段** - 上传课程讲义 PDF 文件 - 等待系统完成文档解析(约 2-3 秒) 2. **提问演示** - 输入:"这门课程的主要学习目标是什么?" - 系统返回基于讲义的答案,并标注参考页码 - 继续提问:"如何完成期末作业?" - 系统提供详细的作业要求说明 3. **效果展示** - 展示答案的准确性和参考来源 - 展示对话历史的保存和加载 ### 场景 2:企业文档查询 1. **准备阶段** - 上传公司规章制度文档 - 上传产品说明书文档 2. **提问演示** - 输入:"公司的请假流程是怎样的?" - 系统从规章制度中提取相关内容 - 输入:"产品 A 的保修期是多久?" - 系统从产品说明书中找到答案 3. **效果展示** - 展示多文档知识库的整合能力 - 展示移动端的响应式设计 ## 🛠️ 技术架构 ### 后端技术栈 - **Flask**:轻量级 Web 框架 - **SQLite**:本地数据库,用于存储对话历史和文档信息 - **OpenAI API**:提供智能问答能力 - **LangChain**:文档处理和向量检索(计划中) - **ChromaDB**:向量数据库(计划中) ### 前端技术栈 - **HTML5**:页面结构 - **CSS3**:样式设计,包含响应式布局 - **JavaScript**:交互逻辑和 API 调用 ### 项目结构 ``` 12/ ├── app.py # Flask 应用主文件 ├── requirements.txt # Python 依赖 ├── Project_Design.md # 项目设计文档 ├── README.md # 项目说明文档 ├── knowledge_base.db # SQLite 数据库(自动生成) ├── templates/ │ └── index.html # 前端页面模板 └── static/ ├── style.css # 样式文件 └── script.js # JavaScript 脚本 ``` ## 🔧 API 接口 ### 上传文档 ``` POST /api/upload Content-Type: multipart/form-data Body: file (文件) Response: { id, name, status } ``` ### 获取文档列表 ``` GET /api/documents Response: [{ id, name, status, chunks, created_at }] ``` ### 删除文档 ``` DELETE /api/documents/{doc_id} Response: { success: true } ``` ### 提问 ``` POST /api/ask Content-Type: application/json Body: { question: "问题内容" } Response: { answer, sources: [{ name, page }] } ``` ### 获取对话历史 ``` GET /api/conversations Response: [{ id, question, answer, sources, created_at }] ``` ## 🎨 界面特性 ### 响应式设计 - **桌面端**(>1024px):双栏布局,左侧知识库,右侧聊天 - **平板端**(768px-1024px):单栏布局,优化间距 - **移动端**(<768px):全屏显示,垂直堆叠,大按钮设计 ### 交互反馈 - Toast 通知系统,实时显示操作状态 - 字符计数器,提示输入长度 - 加载状态指示,提升用户体验 - Emoji 图标,增强视觉识别 ## 📝 注意事项 1. **API 密钥**:确保正确配置 OpenAI API 密钥 2. **文档格式**:目前支持 PDF、Word、TXT 格式 3. **问题长度**:建议问题长度在 3-500 字之间 4. **数据库**:对话历史保存在本地 SQLite 数据库中 5. **浏览器兼容**:建议使用 Chrome、Firefox、Edge 等现代浏览器 ## 🚧 未来规划 - [ ] 集成 LangChain 进行更强大的文档处理 - [ ] 使用 ChromaDB 建立向量数据库 - [ ] 支持更多文档格式(Excel、PPT 等) - [ ] 添加文档预览功能 - [ ] 实现对话导出功能 - [ ] 添加用户认证和权限管理 - [ ] 支持多语言问答 ## 📄 许可证 MIT License ## 🤝 贡献 欢迎提交 Issue 和 Pull Request! ## 📧 联系方式 如有问题或建议,请通过以下方式联系: - 提交 Issue - 发送邮件至:your-email@example.com --- ## 👥 团队成员与贡献 (必填) | 姓名 | 学号 | 主要贡献 (具体分工) | |:---:|:---:|:---| | 宋鹏淳 | 2411020126 | (组长) 核心逻辑开发、Prompt 编写 | | 尹子林 | 2411020115 | 前端界面设计、PPT 制作 | | 吴棋昊 | 2411020114 | 文档撰写、测试与 Bug 修复 | 开发心得 (Development Reflection) 1. 选题思考 我选择开发智能知识库问答系统,源于两次真实经历带来的强烈共鸣。一次是课程学习中,面对几百页的 PDF 讲义,想快速找到某个知识点却只能逐页翻阅,浪费大量时间,面临着 “文档繁多但信息获取低效” 的痛点 —— 人工答疑成本高、信息查找耗时长、知识传递不精准。 市面上虽然有一些问答工具,但大多要么需要付费使用,要么不支持自有文档上传,无法满足个性化的知识查询需求。因此,我希望开发一个轻量、易用且精准的智能问答系统,让用户能通过上传自己的文档,快速获取针对性答案,同时自动保存对话历史方便回顾。这个项目的核心价值,就是把 “被动翻阅文档” 变成 “主动精准查询”,真正解决知识获取的效率问题,无论是用于课程答疑、企业文档查询,还是个人资料管理,都能显著降低沟通成本和时间成本。 2. AI 协作体验 2.1 初体验 第一次用 AI 写代码的感觉,就像突然有了一个 “全能助手”,既惊喜又有些不适应。作为一名对 Flask 框架不算精通、对向量检索等 AI 相关技术更是陌生的开发者,原本以为这个项目至少需要一个月才能完成,尤其是文档解析、智能问答接口对接这些核心模块,光是查资料可能就要花大量时间。但当我让 AI 生成 Flask 项目骨架时,它不仅快速给出了完整的目录结构和主程序代码,还附带了详细的注释,甚至提醒了环境变量配置、数据库初始化等容易忽略的细节。 最让我意外的是 AI 对需求的理解能力 —— 我只是大概描述了 “支持 PDF、Word 文档上传并解析”,它就自动推荐了合适的解析库,还考虑到了大文件处理的分块逻辑。这种 “无需纠结基础实现,只需聚焦核心需求” 的开发模式,打破了我之前 “从零开始写每一行代码” 的固有思维,让我能把更多精力放在用户体验优化上,而不是陷入技术细节的泥潭。但初期也有明显的不适应,比如 AI 生成的代码中存在部分冗余逻辑,或者依赖版本不兼容,需要我逐一甄别和调整,这种 “信任与验证并存” 的过程,让我慢慢找到了与 AI 协作的节奏。 2.2 Prompt 交互 最牛 Prompt: text 基于Flask框架,设计一个文档上传与智能问答系统的后端接口,要求:1. 支持PDF、Word、TXT文件上传,自动解析内容并存储;2. 对接OpenAI API实现基于文档内容的问答,返回答案时需标注参考文档名称和页码;3. 提供文档增删查、对话历史查询接口;4. 给出接口请求参数、响应格式示例,以及关键模块的代码实现(包含错误处理和数据验证)。 这也是我觉得最神奇的地方 —— 这个 Prompt 没有多余的描述,却精准覆盖了项目后端的核心需求。AI 返回的结果不仅包含了上传、问答、文档管理等所有必要接口的代码,还考虑到了文件格式验证、API 密钥配置、数据库模型设计等细节,甚至给出了接口调用的示例。原本我以为需要拆分多个步骤逐步实现的功能,AI 一次性就给出了完整且可运行的方案,省去了我大量查阅文档和设计接口的时间。更意外的是,它在代码中加入了异常捕获机制,比如处理文件解析失败、API 调用超时等情况,这些都是我初期没有考虑到的点,极大提升了代码的健壮性。 最坑 Prompt / 交互: 最坑的一次交互是让 AI 实现 “文档解析并提取页码信息” 的功能。我当时的 Prompt 是 “实现 PDF 文档解析,提取文本内容和对应的页码”,AI 很快给出了使用 PyPDF2 库的代码。但实际测试时发现,代码虽然能提取文本,却无法准确对应页码 —— 比如多页 PDF 的文本会被合并成一个字符串,页码信息完全丢失。我反复运行代码,确认不是环境问题后,又去查看 PyPDF2 的官方文档,发现 AI 给出的代码中遗漏了遍历每一页并记录页码的关键逻辑,只是简单读取了所有页面的文本。更麻烦的是,当我指出这个问题后,AI 第二次修改的代码虽然加入了页码记录,但却出现了文本乱码的情况,原因是没有处理 PDF 的编码格式。这次交互让我意识到,AI 虽然能快速生成代码,但对于需要精准细节控制的功能,可能会遗漏关键步骤,尤其是涉及到特定库的具体使用场景时,不能完全依赖 AI 的输出,必须结合官方文档进行验证。 2.3 Bug 解决 印象最深的一个 Bug 是 AI 生成的 “对话历史保存” 功能出现数据重复存储的问题。具体表现为,每次提交问题后,数据库中会同时保存两条完全相同的对话记录,一条有 sources(参考来源)信息,一条没有。我首先查看了 AI 生成的/api/ask接口代码,发现问题出在逻辑处理上:AI 在调用 OpenAI API 获取答案后,先执行了一次对话记录保存(此时 sources 还未解析完成),然后在解析完参考来源后,又执行了一次保存操作,导致重复插入。 为了定位问题,我先打印了代码中的执行流程,确认了两次db.session.add()调用的存在。接着查看代码结构,发现 AI 将 “保存对话” 和 “解析来源” 分成了两个独立的步骤,且没有添加判断条件。找到问题根源后,我对代码进行了修改:将两次保存操作合并,在解析完答案和参考来源后,一次性创建对话记录并保存到数据库中,删除了多余的保存逻辑。同时,我添加了事务处理,确保如果解析来源失败时,对话记录不会被部分保存。 这次经历让我明白,AI 生成的代码可能存在逻辑冗余或流程设计不合理的问题,不能直接运行后就不管。遇到 Bug 时,需要先梳理代码的执行流程,定位问题所在,再结合业务逻辑进行修正。虽然 AI 能快速生成功能代码,但在流程优化和逻辑严谨性上,还需要开发者根据实际场景进行调整。 3. 自我反思 3.1 离开 AI,我还能写出这个吗? 诚实地说,离开 AI,我能写出这个项目,但需要花费至少 3 倍以上的时间,而且功能会相对简陋。首先,在技术选型上,我原本只熟悉 Flask 的基础用法,对于对接 OpenAI API、文档解析库的选择(比如 python-docx 处理 Word 文档)、SQLite 数据库的模型设计等,都需要大量时间查阅资料。尤其是智能问答的核心逻辑 —— 如何将文档内容与用户问题关联起来,返回精准答案并标注来源,这部分涉及到文本分割、向量匹配等知识,我之前几乎没有接触过,没有 AI 的帮助,可能需要先花几周时间学习相关技术,才能开始实现。 其次,在代码实现上,比如响应式布局的 CSS 编写、JavaScript 的交互逻辑(如文件拖拽上传、Toast 通知)、接口的错误处理等,AI 给出的代码虽然需要调整,但提供了完整的实现思路和基础框架。如果离开 AI,我需要逐行编写这些代码,还要解决跨浏览器兼容、移动端适配等细节问题,效率会非常低。而且,项目中的很多优化点,比如对话历史的自动加载、输入长度限制、加载状态指示等,都是 AI 在代码中主动加入的,若仅凭我自己的思考,可能会忽略这些提升用户体验的细节,最终的产品会显得粗糙。 所以,AI 更像是一个 “加速器”,它帮我跳过了基础实现的繁琐过程,但核心的需求分析、功能设计、Bug 修复等环节,仍然需要我自己的判断和能力。 3.2 核心竞争力 AI 时代,程序员的核心竞争力不再是 “写出能运行的代码”,而是 “理解需求、掌控全局、解决复杂问题的能力”。AI 可以快速生成基础代码、实现常规功能,但它无法替代开发者对业务场景的深度理解 —— 比如这个智能知识库系统,AI 能生成问答接口,但它不知道用户在上传大文件时需要分块处理,不知道企业用户需要多文档整合查询,不知道学生用户需要清晰的参考页码标注。这些基于实际使用场景的需求拆解和功能优化,才是产品能否真正解决用户痛苦的关键。 其次,是问题排查和逻辑优化的能力。正如之前遇到的重复存储 Bug、页码提取错误等问题,AI 可能会生成有瑕疵的代码,但开发者需要具备快速定位问题、分析根源并给出最优解决方案的能力。这种能力源于对技术原理的理解、对代码逻辑的掌控,以及过往项目积累的经验,是 AI 短期内无法替代的。 另外,创新思维和用户体验意识也至关重要。AI 生成的代码往往是基于常规方案的实现,而真正有竞争力的产品需要有差异化的亮点。比如这个项目中,我在 AI 生成的基础上,增加了移动端的大按钮设计、对话历史的时间排序、文档处理进度的实时显示等功能,这些都是从用户体验出发的创新优化。AI 无法主动产生这些基于用户需求的创新想法,只能在开发者的引导下实现。 最后,持续学习和适应变化的能力。AI 技术在不断发展,新的工具、新的框架层出不穷,作为程序员,需要保持对新技术的敏感度,学会如何与 AI 高效协作,将 AI 作为提升效率的工具,而不是被技术淘汰。同时,要不断深化自己在特定领域的专业知识,比如 AI 时代,掌握数据分析、机器学习基础、业务逻辑梳理等能力,才能在复杂项目中发挥不可替代的作用。 总而言之,AI 淘汰的是 “只会机械写代码” 的执行者,而真正有核心竞争力的程序员,是能借助 AI 工具,聚焦于需求理解、问题解决、产品创新的 “价值创造者”。 文档解析的具体过程是怎样的? 如何保证问答系统的准确性和可靠性? 有哪些具体的技术挑战和解决方案?