关键词提取工作流节点

2026-06-15 18:37:03 +00:00 · 2025-11-19 15:03:24 +08:00
parent 53c5076212
commit f04db38d6c
2 changed files with 146 additions and 0 deletions
--- a/ruoyi-modules-api/ruoyi-workflow-api/src/main/java/org/ruoyi/workflow/workflow/node/keywordExtractor/KeywordExtractorNode.java
+++ b/ruoyi-modules-api/ruoyi-workflow-api/src/main/java/org/ruoyi/workflow/workflow/node/keywordExtractor/KeywordExtractorNode.java
@@ -0,0 +1,104 @@
+package org.ruoyi.workflow.workflow.node.keywordExtractor;
+
+import dev.langchain4j.data.message.UserMessage;
+import lombok.extern.slf4j.Slf4j;
+import org.apache.commons.lang3.StringUtils;
+import org.ruoyi.workflow.entity.WorkflowComponent;
+import org.ruoyi.workflow.entity.WorkflowNode;
+import org.ruoyi.workflow.util.SpringUtil;
+import org.ruoyi.workflow.workflow.NodeProcessResult;
+import org.ruoyi.workflow.workflow.WfNodeState;
+import org.ruoyi.workflow.workflow.WfState;
+import org.ruoyi.workflow.workflow.WorkflowUtil;
+import org.ruoyi.workflow.workflow.data.NodeIOData;
+import org.ruoyi.workflow.workflow.node.AbstractWfNode;
+
+import java.util.ArrayList;
+import java.util.List;
+
+import static org.ruoyi.workflow.cosntant.AdiConstant.WorkflowConstant.DEFAULT_OUTPUT_PARAM_NAME;
+
+/**
+ * 【节点】关键词提取节点
+ * 使用 LLM 从文本中提取关键词
+ */
+@Slf4j
+public class KeywordExtractorNode extends AbstractWfNode {
+
+    public KeywordExtractorNode(WorkflowComponent wfComponent, WorkflowNode nodeDef, WfState wfState, WfNodeState nodeState) {
+        super(wfComponent, nodeDef, wfState, nodeState);
+    }
+
+    /**
+     * 处理关键词提取
+     * nodeConfig 格式：
+     * {
+     *   "model_name": "deepseek-chat",
+     *   "category": "llm",
+     *   "top_n": 5,
+     *   "prompt": "额外的提示词"
+     * }
+     *
+     * @return 提取的关键词列表
+     */
+    @Override
+    public NodeProcessResult onProcess() {
+        KeywordExtractorNodeConfig config = checkAndGetConfig(KeywordExtractorNodeConfig.class);
+        
+        // 获取输入文本
+        String inputText = getFirstInputText();
+        if (StringUtils.isBlank(inputText)) {
+            log.warn("Keyword extractor node has no input text, node: {}", state.getUuid());
+            // 返回空结果
+            List<NodeIOData> outputs = new ArrayList<>();
+            outputs.add(NodeIOData.createByText(DEFAULT_OUTPUT_PARAM_NAME, "", ""));
+            return NodeProcessResult.builder().content(outputs).build();
+        }
+        
+        log.info("Keyword extractor node config: {}", config);
+        log.info("Input text length: {}", inputText.length());
+        
+        // 构建提示词
+        String prompt = buildPrompt(config, inputText);
+        log.info("Keyword extraction prompt: {}", prompt);
+        
+        // 调用 LLM 进行关键词提取
+        WorkflowUtil workflowUtil = SpringUtil.getBean(WorkflowUtil.class);
+        String modelName = config.getModelName();
+        String category = config.getCategory();
+        List<UserMessage> systemMessage = List.of(UserMessage.from(prompt));
+        
+        // 使用流式调用
+        workflowUtil.streamingInvokeLLM(wfState, state, node, category, modelName, systemMessage);
+        
+        return new NodeProcessResult();
+    }
+    
+    /**
+     * 构建关键词提取的提示词
+     */
+    private String buildPrompt(KeywordExtractorNodeConfig config, String inputText) {
+        StringBuilder promptBuilder = new StringBuilder();
+        
+        // 基础提示词
+        promptBuilder.append("请从以下文本中提取 ").append(config.getTopN()).append(" 个最重要的关键词。\n\n");
+        
+        // 添加自定义提示词（如果有）
+        if (StringUtils.isNotBlank(config.getPrompt())) {
+            promptBuilder.append(config.getPrompt()).append("\n\n");
+        }
+        
+        // 输出格式要求
+        promptBuilder.append("要求：\n");
+        promptBuilder.append("1. 只返回关键词，每个关键词用逗号分隔\n");
+        promptBuilder.append("2. 关键词应该是名词或名词短语\n");
+        promptBuilder.append("3. 按重要性从高到低排序\n");
+        promptBuilder.append("4. 不要添加任何解释或额外的文字\n\n");
+        
+        // 原始文本
+        promptBuilder.append("文本内容：\n");
+        promptBuilder.append(inputText);
+        
+        return promptBuilder.toString();
+    }
+}
--- a/ruoyi-modules-api/ruoyi-workflow-api/src/main/java/org/ruoyi/workflow/workflow/node/keywordExtractor/KeywordExtractorNodeConfig.java
+++ b/ruoyi-modules-api/ruoyi-workflow-api/src/main/java/org/ruoyi/workflow/workflow/node/keywordExtractor/KeywordExtractorNodeConfig.java
@@ -0,0 +1,42 @@
+package org.ruoyi.workflow.workflow.node.keywordExtractor;
+
+import com.fasterxml.jackson.annotation.JsonProperty;
+import jakarta.validation.constraints.Max;
+import jakarta.validation.constraints.Min;
+import jakarta.validation.constraints.NotNull;
+import lombok.Data;
+import lombok.EqualsAndHashCode;
+
+/**
+ * 关键词提取节点配置
+ */
+@EqualsAndHashCode
+@Data
+public class KeywordExtractorNodeConfig {
+    
+    /**
+     * 模型分类（如：llm, embedding 等）
+     */
+    private String category;
+    
+    /**
+     * 模型名称
+     */
+    @NotNull
+    @JsonProperty("model_name")
+    private String modelName;
+    
+    /**
+     * 提取的关键词数量
+     */
+    @Min(1)
+    @Max(50)
+    @JsonProperty("top_n")
+    private Integer topN = 5;
+    
+    /**
+     * 提示词（可选）
+     * 用于指导关键词提取的额外说明
+     */
+    private String prompt;
+}