likunlong
|
ccdbb20935
|
feat: 不选择模型自动选择时走原始默认逻辑;
|
2025-08-27 10:47:29 +08:00 |
|
likunlong
|
4b37cfe97d
|
feat: 失败回调器中使用emitter对象的唯一hash作为key,不再使用session,不与业务进行绑定,同时也保证跨线程调用的正确性;
|
2025-08-27 10:47:26 +08:00 |
|
likunlong
|
c43d4784de
|
feat: 处理在非Web线程中获取Request中token失败的问题;
|
2025-08-27 10:47:25 +08:00 |
|
likunlong
|
359cee28d5
|
feat: 修改目前实现类使用统一重试降级逻辑;
|
2025-08-27 10:47:22 +08:00 |
|
likunlong
|
aa11c1f233
|
feat: 问答时添加统一重试和降级逻辑;
|
2025-08-27 10:47:20 +08:00 |
|
likunlong
|
a0d029c142
|
feat: 自动设置请求参数中的模型名称;
|
2025-08-27 10:47:20 +08:00 |
|
likunlong
|
6ce52befe2
|
feat: 根据是否有附件和是否自动,自动选择模型并且获取服务;
|
2025-08-27 10:47:19 +08:00 |
|
likunlong
|
4f7ad59e46
|
feat: 添加自动获取高优先级模型和服务的逻辑;
|
2025-08-27 10:47:19 +08:00 |
|
l90215
|
b696fde881
|
feat: 合并代码 删除不需要的文件
|
2025-08-27 10:47:19 +08:00 |
|
fy53888
|
00f9a1a55b
|
修改字典下拉带查找功能
|
2025-08-27 10:47:19 +08:00 |
|
fy53888
|
a1c7b86e72
|
备分一下2
|
2025-08-27 10:47:19 +08:00 |
|
fy53888
|
62676a54fb
|
备分一下2
|
2025-08-27 10:47:19 +08:00 |
|
fy53888
|
268be2d9ec
|
更新后端生成類型 Integer出錯的問
|
2025-08-27 10:47:09 +08:00 |
|
fy53888
|
f448a18e44
|
更新后端生成類型 Integer出錯的問題
|
2025-08-27 10:47:07 +08:00 |
|
violateer
|
0cdba56a07
|
feature: 添加开启知识库角色,用户可见个人知识库及角色分配知识库
|
2025-08-27 10:47:01 +08:00 |
|
l90215
|
416f011c73
|
feat: fix代码生成类型问题
|
2025-08-27 10:47:00 +08:00 |
|
violateer
|
caf7f14781
|
feature: 新增生成前端文件模板接口
|
2025-08-27 10:46:51 +08:00 |
|
l90215
|
a6eb98daab
|
feat: fix代码生成类型问题
|
2025-08-27 10:46:37 +08:00 |
|
l90215
|
4834b615a6
|
feat: fix代码生成类型问题
|
2025-08-27 10:46:37 +08:00 |
|
l90215
|
42aabeed96
|
feat: 添加空格
|
2025-08-27 10:46:37 +08:00 |
|
Administrator
|
affdc5e3a6
|
问题概述
1.保存消息和计费逻辑存在耦合
2.修改计费逻辑:
按次计费被阈值限制:旧逻辑把 TIMES 分支放在 totalTokens ≥ 100 的大分支里,导致没到100 token时不扣费,违背“每次调用就扣费”的语义。
token累计不当:TIMES 分支只扣费不处理累计,同时在 totalTokens < 100 时不会进入任何TIMES逻辑,累计会无意义增长。
粒度不稳定:TOKEN 计费一旦达阈值就把 total 全扣完并清零,不利于对账与用户体验。
打印方式:使用 System.out.println,不利于生产追踪。
改动要点
1.新增独立方法
saveMessage(ChatRequest): 只落库。
publishBillingEvent(ChatRequest): 只发布异步计费事件。
保留组合方法 saveMessageAndPublishEvent(ChatRequest) 以便需要一行调用时使用。
调用处已改为“先保存,再发布事件”
SseServiceImpl: 先 saveMessage,再 publishBillingEvent。
SSEEventSourceListener: 同上。
DifyServiceImpl: 同上。
2.计费模式分流:
TIMES:每次调用直接扣费,不累计。
TOKEN:按阈值(100)批量扣费,保留余数,账单颗粒稳定。
保留余数:total = prev + delta;billable = floor(total/threshold)threshold;remainder = total % threshold。
日志替换:统一使用 log.debug。
结构更清晰、可维护。
所有金额计算统一用 BigDecimal,保留两位小数,RoundingMode.HALF_UP
按次计费:每次直接扣费(BigDecimal),边界转 Double
按 token 计费:按阈值批量结算,保留余数;费用=单价(BigDecimal)×可结算token数
1. 消息分类存储
用户消息:role="user", deductCost=null, totalTokens=本次token数, remark="用户消息"
系统账单:role="system", deductCost=实际扣费, totalTokens=计费token数, remark="TIMES_BILLING/TOKEN_BILLING"
2. 数据流程
用户发送消息 → 预检查余额 → 保存用户消息 → 发布计费事件 → 异步扣费 → 保存账单记录
|
2025-08-14 14:00:48 +08:00 |
|
Administrator
|
5a2e08f87d
|
问题概述
1.保存消息和计费逻辑存在耦合
2.修改计费逻辑:
按次计费被阈值限制:旧逻辑把 TIMES 分支放在 totalTokens ≥ 100 的大分支里,导致没到100 token时不扣费,违背“每次调用就扣费”的语义。
token累计不当:TIMES 分支只扣费不处理累计,同时在 totalTokens < 100 时不会进入任何TIMES逻辑,累计会无意义增长。
粒度不稳定:TOKEN 计费一旦达阈值就把 total 全扣完并清零,不利于对账与用户体验。
打印方式:使用 System.out.println,不利于生产追踪。
3.建议数据库不要存扣除金额和累计消耗token,消息表里不需要存“累计到目前为止多少”,否则每条消息都变成快照,既冗余又易不一致
改动要点
1.新增独立方法
saveMessage(ChatRequest): 只落库。
publishBillingEvent(ChatRequest): 只发布异步计费事件。
保留组合方法 saveMessageAndPublishEvent(ChatRequest) 以便需要一行调用时使用。
调用处已改为“先保存,再发布事件”
SseServiceImpl: 先 saveMessage,再 publishBillingEvent。
SSEEventSourceListener: 同上。
DifyServiceImpl: 同上。
2.计费模式分流:
TIMES:每次调用直接扣费,不累计。
TOKEN:按阈值(100)批量扣费,保留余数,账单颗粒稳定。
保留余数:total = prev + delta;billable = floor(total/threshold)threshold;remainder = total % threshold。
日志替换:统一使用 log.debug。
结构更清晰、可维护。
所有金额计算统一用 BigDecimal,保留两位小数,RoundingMode.HALF_UP
按次计费:每次直接扣费(BigDecimal),边界转 Double
按 token 计费:按阈值批量结算,保留余数;费用=单价(BigDecimal)×可结算token数
|
2025-08-08 13:39:37 +08:00 |
|
l90215
|
66518925c1
|
feat: 代码生成模板优化
|
2025-08-07 09:02:16 +08:00 |
|
l90215
|
450ec6db44
|
feat: 优化删除数据模型也删除模型字段sql条件
|
2025-08-05 22:06:05 +08:00 |
|
l90215
|
ab9ff52200
|
feat: 优化删除数据模型也删除模型字段&添加mapper文件注解
|
2025-08-05 19:50:29 +08:00 |
|
l90215
|
10708b7625
|
feat: 优化空指针bug&格式化代码&初始化用户知识库角色配置
|
2025-08-04 20:50:49 +08:00 |
|
ageerle
|
cc4ca69640
|
Merge pull request #143 from violateer/feature/knowledge-role
添加知识库权限控制功能
|
2025-08-02 15:56:42 +08:00 |
|
ageerle
|
3c19a2b7a4
|
Merge pull request #142 from keke-cxn/main
修复:请求地址'/system/role/authUser/selectAll',发生未知异常:cn.dev33.satoken.exce…
|
2025-08-02 15:56:16 +08:00 |
|
keke
|
21c390c4d6
|
修复:1.在使用dify的时候,发送1+1=?模型返回2,但是第二次问他为什么等于2的时候,模型无法获取上下文信息,经过排查,发现缺少conversationId,session表需要添加conversationId字段
2.在使用dify的时候message表中并没有存储模型返回的消息,并且扣除费用、
|
2025-08-02 13:18:30 +08:00 |
|
l90215
|
a24fa7a2b4
|
feat: 调整生成代码结构
|
2025-07-30 09:24:31 +08:00 |
|
l90215
|
897222c41c
|
feat: 调整生成代码结构
|
2025-07-29 23:34:39 +08:00 |
|
l90215
|
a48178685c
|
feat: 更新代码生成功能-优化逻辑
|
2025-07-27 22:37:26 +08:00 |
|
l90215
|
7e60cb357f
|
feat: 更新代码生成功能-优化逻辑
|
2025-07-27 00:33:33 +08:00 |
|
l90215
|
915a393427
|
feat: 更新代码生成功能-优化取数逻辑
|
2025-07-24 12:36:26 +08:00 |
|
l90215
|
de323d8c45
|
feat: 更新代码生成功能-添加数据模型批量添加字段数据
|
2025-07-23 10:46:29 +08:00 |
|
l90215
|
ffe4867d40
|
feat: 更新代码生成功能-二阶段
|
2025-07-22 18:50:37 +08:00 |
|
l90215
|
8b3c0b4134
|
feat: 更新代码生成功能-一阶段
|
2025-07-21 16:03:08 +08:00 |
|
violateer
|
999282210e
|
添加知识库权限控制功能
|
2025-07-20 10:17:50 +08:00 |
|
violateer
|
a99344813f
|
添加知识库权限控制功能
|
2025-07-20 10:05:38 +08:00 |
|
Administratos-User
|
99114d3301
|
修复token不扣费和扣费异常的问题
1.本次提交的token数+未付费token数 判断大于100token的时候就进行扣费,当然这里还可以改成更多,我觉得100合适。
2.不需要进行扣费的地方屏蔽了相关代码。
3.SessionId传递异常 建议前端传递uuid,也就是每次会话的id。
|
2025-07-11 11:59:20 +08:00 |
|
l90215
|
241c6dc57a
|
feat: 修复打开岗位管理爆粗
|
2025-07-10 23:53:17 +08:00 |
|
lindaxia
|
48270add01
|
Merge branch 'main' of https://github.com/ageerle/ruoyi-ai
|
2025-07-06 07:52:25 +08:00 |
|
lindaxia
|
3786644a25
|
新增小程序接口
|
2025-07-06 07:51:38 +08:00 |
|
Yzm
|
daa7b7315b
|
[fix][feat](chat): 添加会话中SaToken-token值传递和使用;修复“自动注入警告 => 用户未登录”
- 新增 BaseContext 类,用于保存和获取当前登录用户的 token
- 在 OpenAIServiceImpl 和 imageServiceImpl 中获取当前会话 token
- 将 token 作为参数传递给 SSEEventSourceListener
- 在 SSEEventSourceListener 中使用 token 进行用户身份验证和权限控制
- 修改 LoginHelper,增加根据 token 获取登录用户信息的方法
- 更新 InjectionMetaObjectHandler,使用 BaseContext 获取当前 token
- 修复对话时出先”自动注入警告 => 用户未登录“
|
2025-07-05 19:12:33 +08:00 |
|
lindaxia
|
d9c47bd983
|
修复删除知识库清空相关表
|
2025-07-01 18:06:49 +08:00 |
|
Yzm
|
fd94a1772f
|
feat(chat): 集成 FastGPT 聊天模型- 在 ChatModeType 枚举中添加 FASTGPT 选项- 新增 FastGPT 相关的实体类和请求响应类
- 实现 FastGPT聊天服务接口
- 添加 FastGPT SSE 事件监听器
|
2025-06-30 22:03:31 +08:00 |
|
l90215
|
4e2ec2dc82
|
feat: 修复修改角色时候报错&优化一些代码风格
|
2025-06-26 10:19:08 +08:00 |
|
ageerle
|
11286de676
|
Merge pull request #118 from MuSan-Li/feature_20250610_add_prompt_template
Feature 20250610 add prompt template
|
2025-06-23 16:36:40 +08:00 |
|
MuSan-Li
|
cc129801b9
|
添加提示词模板
|
2025-06-12 17:06:06 +08:00 |
|
ageerle
|
baa664ac4f
|
feat: 图片识别功能优化
|
2025-06-05 16:00:06 +08:00 |
|