16 Commits

Author SHA1 Message Date
1ca75f6567 refactor(web): 调整 ES TopK 查询返回数量
- 将 ES TopK 查询返回的文档数量从 1 增加到 2
- 注释中提到未来可能采用重排策略,从 10 篇文档中筛选出 2 篇
- 此修改旨在改善聊天机器人的回复质量
2024-11-21 01:00:37 +08:00
ae7edb5e8d 🎨 refactor(rag): 重构 RAG 模型相关代码
- 重构了 rag_controller.go 中的逻辑,使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构,增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑,使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件,实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数,使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件,实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件,实现了结构体到解释字符串的转换
2024-11-20 19:30:11 +08:00
81cd287109 feat(api): 新增 RAG 聊天模式和优化 ES 查询功能
- 新增 RAG 聊天模式常量和前端字段设定
- 修改 Encounters Create 方法中的 ES 同步逻辑
- 更新 Rag ChatSSE 和 ChatWebSocket 方法,支持新的聊天模式
- 重构 NlpWebSocketResult 创建函数,使用新增的常量
- 新增 Encounter 的 TopK 方法,用于 ES 向量搜索
- 更新 DocResult 结构,实现 DocInterface 接口
- 修改 prompts.yml,增加 Diary 模式的提示模板
2024-11-20 17:32:10 +08:00
679d30dc7b feat(nlp): 重构 RAG 聊天模式并添加新功能
- 重构 RAG 聊天模式,支持知识、日记和检测等多种模式
- 新增日记和检测模式的实现
- 更新 API 接口和前端交互逻辑,支持新的聊天模式
- 优化 prompts.yml 文件结构,更好地支持不同模式的提示模板
2024-11-20 13:26:31 +08:00
05383358ff 🐛 refactor(web): 优化 WebSocket 连接的关闭逻辑
- 在 ChatWebSocket 方法中添加了 defer ws.Close(),确保在方法结束时关闭 WebSocket 连接
- 移除了冗余的 ws.Close() 调用,避免重复关闭连接
- 优化了代码结构,提高了代码的可读性和维护性
2024-11-20 12:23:48 +08:00
f263ead51d refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能
- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法,用于将客户端标记为未使用状态
- 优化了资源管理,提高了 GLM 客户端的利用率
2024-11-20 09:01:53 +08:00
ea102eef60 🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理
- 新增 Release 方法,用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构,改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑,确保正确设置 Idle 和 Active 数量
2024-11-20 08:50:22 +08:00
91073fdf7f refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能
- 调整了 ES TopK 查询逻辑,增加了文档类型筛选
- 优化了 WebSocket 的关闭流程,增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法,用于查询特定文档
- 更新了 prompts.yml 文件中的提示语,将"上下文"改为"知识库"
2024-11-19 13:06:39 +08:00
f8a4f1d042 better Embedding with All query 2024-11-19 03:21:28 +08:00
57f7e3f872 基本完成 1. Client 集中管理;2. 长对话保持。 2024-11-19 02:22:39 +08:00
c06bc1f84e 🐱 2024-11-18 00:39:36 +08:00
d2f6f5da5a refactor(web): 优化 WebSocket 错误消息发送
- 移除了未使用的 fmt 包
- 更新了 Rag 结构的注释
- 简化了错误消息的发送逻辑,直接使用 errcode.ErrMsgForUser[code] 作为消息内容
2024-11-18 00:27:33 +08:00
5ca6966b2f 🐛 修正 ws 错误状体的返回。 2024-11-18 00:16:45 +08:00
3413d52316 🎏 finish RAG 2024-11-16 18:18:07 +08:00
2af03cbf13 SSE 版本 2024-11-16 14:00:57 +08:00
d330b6b74c finish simple RAG 2024-11-16 02:38:34 +08:00