浅七系统消息频率及并发规则说明
为保障浅七系统稳定运行、规避平台风控风险并优化用户体验,现对消息频率规则、API并发能力及后续规划同步如下:
================
一、消息频率规则(已放宽)
全平台总限制:每分钟最多处理60条消息(原30条/分钟)
超限处理:超出部分直接丢弃,不予回复
异常提示:高峰期消息无响应为临时限流,等待1分钟重试即可
=============
二、当前大模型API并发能力
大模型对话API设计之初,并发最高承受能力为每分钟80次。
=============
三、后续规划
后期将对大模型对话API并发能力进行升级,进一步提升系统整体承载上限,持续优化高并发场景下的用户使用体验。
