catface_backend_go/app/http/controller/web/rag_controller.go

package web

import (
	"catface/app/global/consts"
	"catface/app/global/errcode"
	"catface/app/global/variable"
	"catface/app/model_res"
	"catface/app/service/nlp"
	"catface/app/service/rag/curd"
	"catface/app/utils/llm_factory"
	"catface/app/utils/micro_service"
	"catface/app/utils/response"
	"io"
	"net/http"
	"strconv"

	"github.com/gin-gonic/gin"
	"github.com/gorilla/websocket"
	"go.uber.org/zap"
)

type Rag struct {
}

func (r *Rag) Release(context *gin.Context) {
	token := context.GetString(consts.ValidatorPrefix + "token")
	if ok := variable.GlmClientHub.ReleaseOneGlmClient(token); ok {
		variable.ZapLog.Info("释放一个 GLM Client",
			zap.String("token", token),
			zap.String("当前空闲连接数", strconv.Itoa(variable.GlmClientHub.Idle)))
	} else {
		variable.ZapLog.Warn("尝试释放一个 GLM Client，但是 token 无效",
			zap.String("当前空闲连接数", strconv.Itoa(variable.GlmClientHub.Idle)))
	}

	response.Success(context, consts.CurdStatusOkMsg, "")
}

// v1 Http-POST 版本; chat 需要不使用 ch 的版本。
// func (r *Rag) Chat(context *gin.Context) {
// 	// 1. query embedding
// 	query := context.GetString(consts.ValidatorPrefix + "query")
// 	embedding, ok := nlp.GetEmbedding(query)
// 	if !ok {
// 		code := errcode.ErrPythonService
// 		response.Fail(context, code, errcode.ErrMsg[code], "")
// 		return
// 	}

// 	// 2. ES TopK
// 	docs, err := model_es.CreateDocESFactory().TopK(embedding, 1)
// 	if err != nil || len(docs) == 0 {
// 		variable.ZapLog.Error("ES TopK error", zap.Error(err))

// 		code := errcode.ErrNoDocFound
// 		response.Fail(context, code, errcode.ErrMsg[code], errcode.ErrMsgForUser[code])
// 	}

// 	// 3. LLM answer
// 	if answer, err := nlp.ChatKnoledgeRAG(docs[0].Content, query); err == nil {
// 		response.Success(context, consts.CurdStatusOkMsg, gin.H{
// 			"answer": answer,
// 		})
// 	} else {
// 		response.Fail(context, consts.CurdStatusOkCode, consts.CurdStatusOkMsg, "")
// 	}
// }

func (r *Rag) ChatSSE(context *gin.Context) {
	query := context.Query("query")
	token := context.Query("token")

	mode := context.Query("mode")
	if mode == "" {
		mode = consts.RagChatModeKnowledge
	}

	// 0-1. 测试 python
	if !micro_service.TestLinkPythonService() {
		code := errcode.ErrPythonService
		response.Fail(context, code, errcode.ErrMsg[code], "")
		return
	}

	// 0-2. 获取一个 GLM Client
	if token == "" {
		token = variable.SnowFlake.GetIdAsString()
	}
	client, ercode := variable.GlmClientHub.GetOneGlmClient(token, llm_factory.GlmModeKnowledgeHub)
	if ercode != 0 {
		response.Fail(context, ercode, errcode.ErrMsg[ercode], errcode.ErrMsgForUser[ercode])
		return
	}
	defer variable.GlmClientHub.UnavtiveOneGlmClient(token) // INFO ws 结束时，取消 Avtive 的占用。

	// 1. query embedding
	embedding, ok := nlp.GetEmbedding([]string{query})
	if !ok {
		code := errcode.ErrPythonService
		response.Fail(context, code, errcode.ErrMsg[code], "")
		return
	}

	// 2. ES TopK
	dochub, err := curd.TopK(mode, embedding, 1)
	if err != nil || dochub.Length() == 0 {
		variable.ZapLog.Error("ES TopK error", zap.Error(err))

		code := errcode.ErrNoDocFound
		response.Fail(context, code, errcode.ErrMsg[code], errcode.ErrMsgForUser[code])
	}

	// UPDATE
	closeEventFromVue := context.Request.Context().Done()
	ch := make(chan string) // TIP 建立通道。

	// 3. LLM answer
	go func() {
		err := nlp.ChatRAG(query, mode, dochub, ch, client)
		if err != nil {
			variable.ZapLog.Error("ChatKnoledgeRAG error", zap.Error(err))
		}
		close(ch)
	}()

	context.Stream(func(w io.Writer) bool {
		select {
		case c, ok := <-ch:
			if !ok {
				return false
			}
			context.SSEvent("chat", c)
			return true
		case <-closeEventFromVue:
			return false
		}
	})
}

var upgrader = websocket.Upgrader{ // TEST 测试，先写一个裸的 wss
	ReadBufferSize:  1024,
	WriteBufferSize: 1024,
	CheckOrigin: func(r *http.Request) bool {
		return true // info 在生产环境中可能需要更安全的检查
	},
}

func (r *Rag) ChatWebSocket(context *gin.Context) {
	query := context.Query("query")
	token := context.Query("token")

	// INFO 查询模式
	mode := context.Query("mode")
	if mode == "" {
		mode = consts.RagChatModeKnowledge
	}

	if token == "" {
		token = variable.SnowFlake.GetIdAsString()
	}

	// 0-1. 协议升级
	ws, err := upgrader.Upgrade(context.Writer, context.Request, nil)
	if err != nil {
		variable.ZapLog.Error("OnOpen error", zap.Error(err))
		response.Fail(context, errcode.ErrWebsocketUpgradeFail, errcode.ErrMsg[errcode.ErrWebsocketUpgradeFail], "")
		return
	}
	defer ws.Close()

	// 0-2. 测试 Python 微服务是否启动
	if !micro_service.TestLinkPythonService() {
		code := errcode.ErrPythonServierDown
		err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
		}
		return
	}

	// 0-3. 从 GLM_HUB 中获取一个可用的 glm client;
	clientInfo, ercode := variable.GlmClientHub.GetOneGlmClientInfo(token, llm_factory.GlmModeKnowledgeHub)
	if ercode != 0 {
		variable.ZapLog.Error("GetOneGlmClient error", zap.Error(err))
		err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[ercode]).JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
		}
		return
	}
	defer variable.GlmClientHub.UnavtiveOneGlmClient(token) // INFO ws 结束时，取消 Avtive 的占用。

	// 1. query embedding
	clientInfo.AddQuery(query)
	embedding, ok := nlp.GetEmbedding(clientInfo.UserQuerys)
	if !ok {
		code := errcode.ErrPythonServierDown
		err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
		}
		return
	}

	// 2. ES TopK // INFO 这里需要特化选取不同知识库的文档；目前是依靠显式的路由。
	dochub, err := curd.TopK(mode, embedding, 2) // 更好的做法是【重排】 10 -> 2;
	if err != nil || dochub.Length() == 0 {
		variable.ZapLog.Error("ES TopK error", zap.Error(err))

		code := errcode.ErrNoDocFound
		err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
		}
		return
	}

	// STAGE websocket 的 defer 关闭函数，但是需要 ES 拿到的 doc—id
	defer func() { // UPDATE 临时"持久化"方案，之后考虑结合 jwt 维护的 token 处理。
		// 0. 传递参考资料的信息
		docMsg := model_res.CreateNlpWebSocketResult(consts.AiMessageTypeDoc, dochub.Docs)
		err := ws.WriteMessage(websocket.TextMessage, docMsg.JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send doc message via WebSocket", zap.Error(err))
		}

		// 1. 传递 token 信息； // UPDATE 临时方案
		tokenMsg := model_res.CreateNlpWebSocketResult(consts.AiMessageTypeToken, token)
		err = ws.WriteMessage(websocket.TextMessage, tokenMsg.JsonMarshal())
		if err != nil {
			variable.ZapLog.Error("Failed to send token message via WebSocket", zap.Error(err))
		}
		// ws.Close()  // 在上面调用了 defer；// TIP defer 的“栈”性质。
	}()

	// 3.
	closeEventFromVue := context.Request.Context().Done() // 接收前端传来的中断信号。
	ch := make(chan string)                               // TIP 建立通道。

	go func() {
		err := nlp.ChatRAG(query, mode, dochub, ch, clientInfo.Client) // TIP 接口
		if err != nil {
			variable.ZapLog.Error("ChatKnoledgeRAG error", zap.Error(err))
		}
		close(ch) // 这里 close，使得下方 for 结束。
	}()

	for {
		select {
		case c, ok := <-ch:
			if !ok {
				return
			}
			// variable.ZapLog.Info("ChatKnoledgeRAG", zap.String("c", c))
			err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", c).JsonMarshal())
			if err != nil {
				return
			}
		case <-closeEventFromVue:
			return
		}
	}
}

func (r *Rag) HelpDetectCat(context *gin.Context) {
	// TODO 也许也可以同样用上面那个接口了。
}
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+								package web
 								import (
-												🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理

- 新增 Release 方法，用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构，改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑，确保正确设置 Idle 和 Active 数量

											
										
										
											2024-11-20 08:50:22 +08:00
+									"catface/app/global/consts"
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									"catface/app/global/errcode"
 									"catface/app/global/variable"
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+									"catface/app/model_res"
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									"catface/app/service/nlp"
-												refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能

- 调整了 ES TopK 查询逻辑，增加了文档类型筛选
- 优化了 WebSocket 的关闭流程，增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法，用于查询特定文档
- 更新了 prompts.yml 文件中的提示语，将"上下文"改为"知识库"

											
										
										
											2024-11-19 13:06:39 +08:00
+									"catface/app/service/rag/curd"
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									"catface/app/utils/llm_factory"
 									"catface/app/utils/micro_service"
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									"catface/app/utils/response"
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
+									"io"
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									"net/http"
-												🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理

- 新增 Release 方法，用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构，改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑，确保正确设置 Idle 和 Active 数量

											
										
										
											2024-11-20 08:50:22 +08:00
+									"strconv"
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
 									"github.com/gin-gonic/gin"
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									"github.com/gorilla/websocket"
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									"go.uber.org/zap"
 								)
 								type Rag struct {
 								}
-												🆕 🐛 feat(rag): 添加释放 GLM 客户端接口并优化连接池管理

- 新增 Release 方法，用于释放 GLM 客户端连接
- 优化 GlmClientHub 结构，改用 Idle 和 Active 字段
- 更新相关路由和验证器注册
- 调整初始化逻辑，确保正确设置 Idle 和 Active 数量

											
										
										
											2024-11-20 08:50:22 +08:00
+								func (r *Rag) Release(context *gin.Context) {
 									token := context.GetString(consts.ValidatorPrefix + "token")
 									if ok := variable.GlmClientHub.ReleaseOneGlmClient(token); ok {
 										variable.ZapLog.Info("释放一个 GLM Client",
 											zap.String("token", token),
 											zap.String("当前空闲连接数", strconv.Itoa(variable.GlmClientHub.Idle)))
 									} else {
 										variable.ZapLog.Warn("尝试释放一个 GLM Client，但是 token 无效",
 											zap.String("当前空闲连接数", strconv.Itoa(variable.GlmClientHub.Idle)))
 									}
 									response.Success(context, consts.CurdStatusOkMsg, "")
 								}
-												refactor(web): 优化 WebSocket 错误消息发送

- 移除了未使用的 fmt 包
- 更新了 Rag 结构的注释
- 简化了错误消息的发送逻辑，直接使用 errcode.ErrMsgForUser[code] 作为消息内容

											
										
										
											2024-11-18 00:27:33 +08:00
+								// v1 Http-POST 版本; chat 需要不使用 ch 的版本。
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
+								// func (r *Rag) Chat(context *gin.Context) {
 								// 	// 1. query embedding
 								// 	query := context.GetString(consts.ValidatorPrefix + "query")
 								// 	embedding, ok := nlp.GetEmbedding(query)
 								// 	if !ok {
 								// 		code := errcode.ErrPythonService
 								// 		response.Fail(context, code, errcode.ErrMsg[code], "")
 								// 		return
 								// 	}
 								// 	// 2. ES TopK
 								// 	docs, err := model_es.CreateDocESFactory().TopK(embedding, 1)
 								// 	if err != nil || len(docs) == 0 {
 								// 		variable.ZapLog.Error("ES TopK error", zap.Error(err))
 								// 		code := errcode.ErrNoDocFound
 								// 		response.Fail(context, code, errcode.ErrMsg[code], errcode.ErrMsgForUser[code])
 								// 	}
 								// 	// 3. LLM answer
 								// 	if answer, err := nlp.ChatKnoledgeRAG(docs[0].Content, query); err == nil {
 								// 		response.Success(context, consts.CurdStatusOkMsg, gin.H{
 								// 			"answer": answer,
 								// 		})
 								// 	} else {
 								// 		response.Fail(context, consts.CurdStatusOkCode, consts.CurdStatusOkMsg, "")
 								// 	}
 								// }
 								func (r *Rag) ChatSSE(context *gin.Context) {
 									query := context.Query("query")
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									token := context.Query("token")
-												feat(api): 新增 RAG 聊天模式和优化 ES 查询功能

- 新增 RAG 聊天模式常量和前端字段设定
- 修改 Encounters Create 方法中的 ES 同步逻辑
- 更新 Rag ChatSSE 和 ChatWebSocket 方法，支持新的聊天模式
- 重构 NlpWebSocketResult 创建函数，使用新增的常量
- 新增 Encounter 的 TopK 方法，用于 ES 向量搜索
- 更新 DocResult 结构，实现 DocInterface 接口
- 修改 prompts.yml，增加 Diary 模式的提示模板

											
										
										
											2024-11-20 17:32:10 +08:00
+									mode := context.Query("mode")
 									if mode == "" {
 										mode = consts.RagChatModeKnowledge
 									}
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									// 0-1. 测试 python
 									if !micro_service.TestLinkPythonService() {
 										code := errcode.ErrPythonService
 										response.Fail(context, code, errcode.ErrMsg[code], "")
 										return
 									}
 									// 0-2. 获取一个 GLM Client
 									if token == "" {
 										token = variable.SnowFlake.GetIdAsString()
 									}
 									client, ercode := variable.GlmClientHub.GetOneGlmClient(token, llm_factory.GlmModeKnowledgeHub)
 									if ercode != 0 {
 										response.Fail(context, ercode, errcode.ErrMsg[ercode], errcode.ErrMsgForUser[ercode])
 										return
 									}
-												refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能

- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法，用于将客户端标记为未使用状态
- 优化了资源管理，提高了 GLM 客户端的利用率

											
										
										
											2024-11-20 09:01:53 +08:00
+									defer variable.GlmClientHub.UnavtiveOneGlmClient(token) // INFO ws 结束时，取消 Avtive 的占用。
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									// 1. query embedding
-												better Embedding with All query

											
										
										
											2024-11-19 03:21:28 +08:00
+									embedding, ok := nlp.GetEmbedding([]string{query})
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									if !ok {
 										code := errcode.ErrPythonService
 										response.Fail(context, code, errcode.ErrMsg[code], "")
 										return
 									}
 									// 2. ES TopK
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+									dochub, err := curd.TopK(mode, embedding, 1)
 									if err != nil || dochub.Length() == 0 {
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+										variable.ZapLog.Error("ES TopK error", zap.Error(err))
 										code := errcode.ErrNoDocFound
 										response.Fail(context, code, errcode.ErrMsg[code], errcode.ErrMsgForUser[code])
 									}
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
+									// UPDATE
 									closeEventFromVue := context.Request.Context().Done()
 									ch := make(chan string) // TIP 建立通道。
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+									// 3. LLM answer
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
+									go func() {
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := nlp.ChatRAG(query, mode, dochub, ch, client)
-												✨ SSE 版本

											
										
										
											2024-11-16 14:00:57 +08:00
+										if err != nil {
 											variable.ZapLog.Error("ChatKnoledgeRAG error", zap.Error(err))
 										}
 										close(ch)
 									}()
 									context.Stream(func(w io.Writer) bool {
 										select {
 										case c, ok := <-ch:
 											if !ok {
 												return false
 											}
 											context.SSEvent("chat", c)
 											return true
 										case <-closeEventFromVue:
 											return false
 										}
 									})
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+								}
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+								var upgrader = websocket.Upgrader{ // TEST 测试，先写一个裸的 wss
 									ReadBufferSize:  1024,
 									WriteBufferSize: 1024,
 									CheckOrigin: func(r *http.Request) bool {
 										return true // info 在生产环境中可能需要更安全的检查
 									},
 								}
 								func (r *Rag) ChatWebSocket(context *gin.Context) {
 									query := context.Query("query")
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									token := context.Query("token")
-												feat(nlp): 重构 RAG 聊天模式并添加新功能

- 重构 RAG 聊天模式，支持知识、日记和检测等多种模式
- 新增日记和检测模式的实现
- 更新 API 接口和前端交互逻辑，支持新的聊天模式
- 优化 prompts.yml 文件结构，更好地支持不同模式的提示模板

											
										
										
											2024-11-20 13:26:31 +08:00
+									// INFO 查询模式
 									mode := context.Query("mode")
 									if mode == "" {
 										mode = consts.RagChatModeKnowledge
 									}
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									if token == "" {
 										token = variable.SnowFlake.GetIdAsString()
 									}
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									// 0-1. 协议升级
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									ws, err := upgrader.Upgrade(context.Writer, context.Request, nil)
 									if err != nil {
 										variable.ZapLog.Error("OnOpen error", zap.Error(err))
 										response.Fail(context, errcode.ErrWebsocketUpgradeFail, errcode.ErrMsg[errcode.ErrWebsocketUpgradeFail], "")
 										return
 									}
-												🐛 refactor(web): 优化 WebSocket 连接的关闭逻辑

- 在 ChatWebSocket 方法中添加了 defer ws.Close()，确保在方法结束时关闭 WebSocket 连接
- 移除了冗余的 ws.Close() 调用，避免重复关闭连接
- 优化了代码结构，提高了代码的可读性和维护性

											
										
										
											2024-11-20 12:23:48 +08:00
+									defer ws.Close()
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
 									// 0-2. 测试 Python 微服务是否启动
 									if !micro_service.TestLinkPythonService() {
 										code := errcode.ErrPythonServierDown
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+										if err != nil {
 											variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
 										}
 										return
 									}
 									// 0-3. 从 GLM_HUB 中获取一个可用的 glm client;
-												better Embedding with All query

											
										
										
											2024-11-19 03:21:28 +08:00
+									clientInfo, ercode := variable.GlmClientHub.GetOneGlmClientInfo(token, llm_factory.GlmModeKnowledgeHub)
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+									if ercode != 0 {
 										variable.ZapLog.Error("GetOneGlmClient error", zap.Error(err))
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[ercode]).JsonMarshal())
-												✨ 基本完成 1. Client 集中管理；2. 长对话保持。

											
										
										
											2024-11-19 02:22:39 +08:00
+										if err != nil {
 											variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
 										}
 										return
 									}
-												refactor(llm_factory): 新增 GLM 客户端未使用资源释放功能

- 在 NlpController 和 RagController 中添加了释放 GLM 客户端资源的逻辑
- 在 GlmClientHub 中增加了 UnavtiveOneGlmClient 方法，用于将客户端标记为未使用状态
- 优化了资源管理，提高了 GLM 客户端的利用率

											
										
										
											2024-11-20 09:01:53 +08:00
+									defer variable.GlmClientHub.UnavtiveOneGlmClient(token) // INFO ws 结束时，取消 Avtive 的占用。
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
 									// 1. query embedding
-												better Embedding with All query

											
										
										
											2024-11-19 03:21:28 +08:00
+									clientInfo.AddQuery(query)
 									embedding, ok := nlp.GetEmbedding(clientInfo.UserQuerys)
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									if !ok {
-												🐱

											
										
										
											2024-11-18 00:39:36 +08:00
+										code := errcode.ErrPythonServierDown
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
-												🐛 修正 ws 错误状体的返回。

											
										
										
											2024-11-18 00:16:45 +08:00
+										if err != nil {
 											variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
 										}
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+										return
 									}
-												feat(nlp): 重构 RAG 聊天模式并添加新功能

- 重构 RAG 聊天模式，支持知识、日记和检测等多种模式
- 新增日记和检测模式的实现
- 更新 API 接口和前端交互逻辑，支持新的聊天模式
- 优化 prompts.yml 文件结构，更好地支持不同模式的提示模板

											
										
										
											2024-11-20 13:26:31 +08:00
+									// 2. ES TopK // INFO 这里需要特化选取不同知识库的文档；目前是依靠显式的路由。
-												refactor(web): 调整 ES TopK 查询返回数量

- 将 ES TopK 查询返回的文档数量从 1 增加到 2
- 注释中提到未来可能采用重排策略，从 10 篇文档中筛选出 2 篇
- 此修改旨在改善聊天机器人的回复质量

											
										
										
											2024-11-21 01:00:37 +08:00
+									dochub, err := curd.TopK(mode, embedding, 2) // 更好的做法是【重排】 10 -> 2;
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+									if err != nil || dochub.Length() == 0 {
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+										variable.ZapLog.Error("ES TopK error", zap.Error(err))
 										code := errcode.ErrNoDocFound
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", errcode.ErrMsgForUser[code]).JsonMarshal())
-												🐛 修正 ws 错误状体的返回。

											
										
										
											2024-11-18 00:16:45 +08:00
+										if err != nil {
 											variable.ZapLog.Error("Failed to send error message via WebSocket", zap.Error(err))
 										}
 										return
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									}
-												refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能

- 调整了 ES TopK 查询逻辑，增加了文档类型筛选
- 优化了 WebSocket 的关闭流程，增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法，用于查询特定文档
- 更新了 prompts.yml 文件中的提示语，将"上下文"改为"知识库"

											
										
										
											2024-11-19 13:06:39 +08:00
+									// STAGE websocket 的 defer 关闭函数，但是需要 ES 拿到的 doc—id
 									defer func() { // UPDATE 临时"持久化"方案，之后考虑结合 jwt 维护的 token 处理。
 										// 0. 传递参考资料的信息
-												refactor(web): 调整 ES TopK 查询返回数量

- 将 ES TopK 查询返回的文档数量从 1 增加到 2
- 注释中提到未来可能采用重排策略，从 10 篇文档中筛选出 2 篇
- 此修改旨在改善聊天机器人的回复质量

											
										
										
											2024-11-21 01:00:37 +08:00
+										docMsg := model_res.CreateNlpWebSocketResult(consts.AiMessageTypeDoc, dochub.Docs)
-												refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能

- 调整了 ES TopK 查询逻辑，增加了文档类型筛选
- 优化了 WebSocket 的关闭流程，增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法，用于查询特定文档
- 更新了 prompts.yml 文件中的提示语，将"上下文"改为"知识库"

											
										
										
											2024-11-19 13:06:39 +08:00
+										err := ws.WriteMessage(websocket.TextMessage, docMsg.JsonMarshal())
 										if err != nil {
 											variable.ZapLog.Error("Failed to send doc message via WebSocket", zap.Error(err))
 										}
 										// 1. 传递 token 信息； // UPDATE 临时方案
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										tokenMsg := model_res.CreateNlpWebSocketResult(consts.AiMessageTypeToken, token)
-												refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能

- 调整了 ES TopK 查询逻辑，增加了文档类型筛选
- 优化了 WebSocket 的关闭流程，增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法，用于查询特定文档
- 更新了 prompts.yml 文件中的提示语，将"上下文"改为"知识库"

											
										
										
											2024-11-19 13:06:39 +08:00
+										err = ws.WriteMessage(websocket.TextMessage, tokenMsg.JsonMarshal())
 										if err != nil {
 											variable.ZapLog.Error("Failed to send token message via WebSocket", zap.Error(err))
 										}
-												🐛 refactor(web): 优化 WebSocket 连接的关闭逻辑

- 在 ChatWebSocket 方法中添加了 defer ws.Close()，确保在方法结束时关闭 WebSocket 连接
- 移除了冗余的 ws.Close() 调用，避免重复关闭连接
- 优化了代码结构，提高了代码的可读性和维护性

											
										
										
											2024-11-20 12:23:48 +08:00
+										// ws.Close()  // 在上面调用了 defer；// TIP defer 的“栈”性质。
-												refactor(app): 重构 WebSocket 聊天流程并优化文档查询功能

- 调整了 ES TopK 查询逻辑，增加了文档类型筛选
- 优化了 WebSocket 的关闭流程，增加了文档和 token 信息的发送
- 新增了 Doc 模型的 ShowById 和 ShowByIds 方法，用于查询特定文档
- 更新了 prompts.yml 文件中的提示语，将"上下文"改为"知识库"

											
										
										
											2024-11-19 13:06:39 +08:00
+									}()
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+									// 3.
 									closeEventFromVue := context.Request.Context().Done() // 接收前端传来的中断信号。
 									ch := make(chan string)                               // TIP 建立通道。
 									go func() {
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+										err := nlp.ChatRAG(query, mode, dochub, ch, clientInfo.Client) // TIP 接口
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+										if err != nil {
 											variable.ZapLog.Error("ChatKnoledgeRAG error", zap.Error(err))
 										}
 										close(ch) // 这里 close，使得下方 for 结束。
 									}()
 									for {
 										select {
 										case c, ok := <-ch:
 											if !ok {
 												return
 											}
 											// variable.ZapLog.Info("ChatKnoledgeRAG", zap.String("c", c))
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+											err := ws.WriteMessage(websocket.TextMessage, model_res.CreateNlpWebSocketResult("", c).JsonMarshal())
-												🎏 finish RAG

											
										
										
											2024-11-16 18:18:07 +08:00
+											if err != nil {
 												return
 											}
 										case <-closeEventFromVue:
 											return
 										}
 									}
 								}
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+								func (r *Rag) HelpDetectCat(context *gin.Context) {
-												🎨 refactor(rag): 重构 RAG 模型相关代码

- 重构了 rag_controller.go 中的逻辑，使用新的 DocumentHub 结构
- 修改了 encounter.go 中的 Encounter 结构，增加了 explain 标签
- 重写了 rag_websocket.go 中的逻辑，使用新的 DocumentHub 结构
- 新增了 curd_es/encounter_es_curd.go 文件，实现了 Encounter 的 CURD 操作
- 更新了 nlp/func.go 中的 ChatRAG 函数，使用新的 DocumentHub 结构
- 新增了 curd/docs_hub.go 文件，实现了 DocumentHub 的 TopK 方法
- 新增了 utils/data_explain/data_explain_rag.go 文件，实现了结构体到解释字符串的转换

											
										
										
											2024-11-20 19:30:11 +08:00
+									// TODO 也许也可以同样用上面那个接口了。
-												✨ finish simple RAG

											
										
										
											2024-11-16 02:38:34 +08:00
+								}