11 Commits

Author SHA1 Message Date
f263ead51d refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能
- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法,用于将客户端标记为未使用状态
- 优化了资源管理,提高了 GLM 客户端的利用率
2024-11-20 09:01:53 +08:00
ea102eef60 🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理
- 新增 Release 方法,用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构,改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑,确保正确设置 Idle 和 Active 数量
2024-11-20 08:50:22 +08:00
91073fdf7f refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能
- 调整了 ES TopK 查询逻辑,增加了文档类型筛选
- 优化了 WebSocket 的关闭流程,增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法,用于查询特定文档
- 更新了 prompts.yml 文件中的提示语,将"上下文"改为"知识库"
2024-11-19 13:06:39 +08:00
f8a4f1d042 better Embedding with All query 2024-11-19 03:21:28 +08:00
57f7e3f872 基本完成 1. Client 集中管理;2. 长对话保持。 2024-11-19 02:22:39 +08:00
c06bc1f84e 🐱 2024-11-18 00:39:36 +08:00
d2f6f5da5a refactor(web): 优化 WebSocket 错误消息发送
- 移除了未使用的 fmt 包
- 更新了 Rag 结构的注释
- 简化了错误消息的发送逻辑,直接使用 errcode.ErrMsgForUser[code] 作为消息内容
2024-11-18 00:27:33 +08:00
5ca6966b2f 🐛 修正 ws 错误状体的返回。 2024-11-18 00:16:45 +08:00
3413d52316 🎏 finish RAG 2024-11-16 18:18:07 +08:00
2af03cbf13 SSE 版本 2024-11-16 14:00:57 +08:00
d330b6b74c finish simple RAG 2024-11-16 02:38:34 +08:00