|
f263ead51d
|
refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能
- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法,用于将客户端标记为未使用状态
- 优化了资源管理,提高了 GLM 客户端的利用率
|
2024-11-20 09:01:53 +08:00 |
|
|
ea102eef60
|
🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理
- 新增 Release 方法,用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构,改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑,确保正确设置 Idle 和 Active 数量
|
2024-11-20 08:50:22 +08:00 |
|
|
91073fdf7f
|
refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能
- 调整了 ES TopK 查询逻辑,增加了文档类型筛选
- 优化了 WebSocket 的关闭流程,增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法,用于查询特定文档
- 更新了 prompts.yml 文件中的提示语,将"上下文"改为"知识库"
|
2024-11-19 13:06:39 +08:00 |
|
|
f8a4f1d042
|
better Embedding with All query
|
2024-11-19 03:21:28 +08:00 |
|
|
57f7e3f872
|
✨ 基本完成 1. Client 集中管理;2. 长对话保持。
|
2024-11-19 02:22:39 +08:00 |
|
|
c06bc1f84e
|
🐱
|
2024-11-18 00:39:36 +08:00 |
|
|
d2f6f5da5a
|
refactor(web): 优化 WebSocket 错误消息发送
- 移除了未使用的 fmt 包
- 更新了 Rag 结构的注释
- 简化了错误消息的发送逻辑,直接使用 errcode.ErrMsgForUser[code] 作为消息内容
|
2024-11-18 00:27:33 +08:00 |
|
|
5ca6966b2f
|
🐛 修正 ws 错误状体的返回。
|
2024-11-18 00:16:45 +08:00 |
|
|
3413d52316
|
🎏 finish RAG
|
2024-11-16 18:18:07 +08:00 |
|
|
2af03cbf13
|
✨ SSE 版本
|
2024-11-16 14:00:57 +08:00 |
|
|
d330b6b74c
|
✨ finish simple RAG
|
2024-11-16 02:38:34 +08:00 |
|