文档管理
文档管理是知识库的核心功能,支持多种文档来源和格式。
📥 添加文档
支持的文档来源
| 来源 | 描述 |
|---|---|
| 文件上传 | 从本地上传文件 |
| 文本粘贴 | 直接粘贴文本内容 |
| 外部表格 | 从钉钉/飞书导入表格 |
| 网页抓取 | 从 URL 抓取网页内容 |
文件上传
- 点击 添加文档 → 上传文件
- 从电脑选择文件
- 配置分块设置(可选)
- 点击 上传
支持的格式:
.txt- 纯文本文件.md- Markdown 文件.pdf- PDF 文档.doc,.docx- Word 文档
文本粘贴
- 点击 添加文档 → 粘贴文本
- 输入文档标题
- 粘贴或输入内容
- 点击 保存
适合快速创建小型文档。
外部表格
- 点击 添加文档 → 外部表格
- 输入表格 URL(钉钉/飞书)
- 配置同步设置
- 点击 导入
支持从在线表格服务导入数据。
网页抓取
- 点击 添加文档 → 网页 URL
- 输入网页地址
- 系统抓取并处理内容
- 点击 导入
网页文档支持重新抓取更新。当网页内容变化时,可使用刷新功能获取最新内容。
📋 文档列表
列表功能
- 搜索:按名称搜索文档
- 排序:按名称、大小、日期排序
- 筛选:按状态筛选文档
文档状态
| 状态 | 描述 |
|---|---|
| 已启用 | 文档已索引且可搜索 |
| 已禁用 | 文档存在但不参与搜索 |
| 处理中 | 文档正在索引 |
| 错误 | 索引失败 |
✏️ 管理操作
基本操作
| 操作 | 描述 |
|---|---|
| 查看详情 | 查看文档内容和元数据 |
| 编辑 | 修改文档名称和设置 |
| 启用/禁用 | 切换文档是否参与搜索 |
| 重新索引 | 使用新设置重新处理文档 |
| 删除 | 永久移除文档 |
| 查看分块 | 检查文档如何被分割 |
批量操作
支持多选文档进行批量操作:
- 使用复选框选择多个文档
- 点击 全选 选择所有文档
- 点击 批量删除 删除选中的文档
📌 笔记本模式的文档选择
在笔记本模式下,文档列表支持选择功能:
选择功能
- 选择特定文档:勾选文档将其加入上下文
- 全选/取消全选:快速选择或取消所有文档
- 自动选择:新上传的文档自动被选中
上下文注入
选择的文档会在对话中作为上下文提供给 AI,帮助 AI 更好地理解和回答问题。
🔍 文档编辑
可编辑内容
- 文档名称:修改文档的显示名称
- 分块设置:调整文档的分块策略
- 启用状态:控制文档是否参与检索
编辑限制
- 来源类型:不能更改文档的来源类型
- 文件内容:文件类文档的内容不能直接编辑
- 表格 URL:外部表格的 URL 不能直接修改
🔄 网页文档刷新
网页文档支持重新抓取:
- 在文档列表中找到网页文档
- 点击 刷新 按钮
- 系统将重新抓取网页内容
- 更新后的内容将自动重新索引
适合跟踪经常更新的网页内容。
💡 最佳实践
文档组织
| 实践 | 描述 |
|---|---|
| 有意义的名称 | 使用描述性的文档名称 |
| 一致的格式 | 标准化文档格式 |
| 定期更新 | 文档变更时重新索引 |
| 清洁内容 | 移除无关的页眉/页脚 |
文档大小
- 单个文件建议不超过 50MB
- 超大文档可以拆分成多个小文档
- 文本类文档比扫描版 PDF 更易处理