4 Commits

Author SHA1 Message Date
f263ead51d refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能
- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法,用于将客户端标记为未使用状态
- 优化了资源管理,提高了 GLM 客户端的利用率
2024-11-20 09:01:53 +08:00
57f7e3f872 基本完成 1. Client 集中管理;2. 长对话保持。 2024-11-19 02:22:39 +08:00
d330b6b74c finish simple RAG 2024-11-16 02:38:34 +08:00
f26c9c0528 add title API 2024-11-06 01:27:14 +08:00