Go + Redis 实现可恢复的 LLM 流式推送：断线不丢数据的实战方案

张

张建站

2026/4/24 3:24:13

10分钟阅读

做 LLM 流式输出的时候用户刷新一下页面流就断了后端还在跑token 白烧。本文分享一种基于 Redis Streams 的断线续传方案附完整 Go 代码。一、问题背景最近做了一个 AI 对话服务后端 GoLLM 输出通过 SSE 推给前端。上线后发现一个很头疼的问题用户刷新页面 → SSE 断了 → 后端还在跑 → token 白烧用户看不到输出 → 点重新生成 → 又烧一遍钱分布式部署下LLM worker 和 HTTP handler 不在同一台机器重连后负载均衡打到新节点找不到原来的流二、JS 生态有方案Go 没有调研了一圈JS/TS 已经有成熟方案方案说明vercel/resumable-streamVercel 官方绑定 AI SDKdurable-streamsElectricSQL 出品多语言 SDK需要跑专用 serverai-resumable-stream社区方案也是绑 AI SDK核心思路都一样chunk 存 Redis断线重连时 replay。但 Go 生态里一个能用的都没有。三、方案设计自己造了个轮子streamhub3.1 架构LLM Worker (Instance A) │ ├── Publish chunks ──→ Redis Stream持久化 │ │ │ ├──→ Consumer (Instance B) ──→ SSE │ └──→ 新连接自动 replay 历史 │ └── Listen cancel ←── Redis Pub/Sub ←── 任意节点3.2 两个 Redis 原语Redis StreamsXADD/XREAD存 chunk支持从任意位置回放Redis Pub/Sub传 cancel 信号延迟低3.3 防重复机制Generation ID作为 fencing token旧 producer 的写入会被拒绝单 Producer 注册同 session 只允许一个 producer不会重复调 LLM四、核心代码4.1 安装go get github.com/gtoxlili/streamhubv0.1.04.2 创建 Hubclient,_:rueidis.NewClient(rueidis.ClientOption{InitAddress:[]string{127.0.0.1:6379},})hub:streamhub.New(client)4.3 生产端stream,created,err:hub.Register(chat:123,func(){// 收到 cancel 信号的回调llmCancel()})if!created{return// 其他实例已经在跑了}deferstream.Close()// 可以设置 metadatastream.SetMetadata(map[string]any{model:gpt-4})fortoken:rangellmOutput{stream.Publish(token)}关键点created为false说明已有 producer不要重复生产。4.4 消费端任意实例stream:hub.Get(chat:123)ifstreamnil{return// session 不存在}chunks,unsub:stream.Subscribe(128)deferunsub()forchunk:rangechunks{// 自动先 replay 历史再无缝切 livefmt.Fprintf(w,data: %s\n\n,chunk)w.(http.Flusher).Flush()}4.5 远程取消hub.Get(chat:123).Cancel()// 通过 Redis Pub/Sub 广播producer 所在实例收到回调五、对比特性streamhubvercel/resumable-streamdurable-streams语言GoTypeScript多语言存储复用现有 RedisRedis专用 server断线 replay✅✅✅跨实例 cancel✅❌❌单 producer✅❌❌额外依赖无Vercel AI SDK需部署 server六、适用场景LLM / AI Agent 流式响应需要断线续传SSE / WebSocket 推送要求不丢数据微服务架构生产者消费者在不同实例从其他服务远程取消正在进行的生成任务七、总结核心就是一句话把流的状态从进程内存搬到 Redis让生产和消费彻底解耦。项目地址github.com/gtoxlili/streamhub目前还在早期阶段API 可能会调整。如果你也在做类似的项目欢迎提 Issue 交流。

2026年AI期权平台推荐：AlphaGBM领跑智能交易新纪元

一、序言：摘要、背景与测评维度模型1. “A.I.R.E”测评维度模型为确保测评的客观与深度，本文独创“A.I.R.E”期权平台评价模型：A (Algorithm 算法精准度)：IV预测准确率、大单异动捕捉能力、期权定价模型的先进性。I (Interface 交…...

2026/4/19 12:49:31 阅读更多 →

开租车行最怕什么？顾客跑单、拖欠租金？这套系统让我彻底放心了

开租车行这几年，踩过的坑比跑过的里程还多。最怕的不是车被刮了、违章了，这些都能处理。最怕的是——人连车带人消失了。租金拖着不给，电话打不通，微信被拉黑。车回来了，钱没回来。更惨的是，车也没回来。后…...

2026/4/19 23:49:11 阅读更多 →

DeepSeek-R1-Distill-Qwen-7B入门实战：从零开始搭建推理环境

DeepSeek-R1-Distill-Qwen-7B入门实战：从零开始搭建推理环境 1. 环境准备与快速部署 1.1 系统要求在开始部署DeepSeek-R1-Distill-Qwen-7B模型前，请确保您的系统满足以下基本要求： 操作系统：推荐使用Linux系统（Ub…...

2026/4/18 17:09:49 阅读更多 →

从T3到T5：全志工控处理器性能跃迁与工业应用场景深度解析

1. 全志T3与T5处理器核心架构解析全志T3（A40I）和T5（T507）作为两代工控处理器，在核心架构上有着显著差异。T3采用四核Cortex-A7架构，主频1.2GHz，搭配Mali400MP2 GPU，属于经典的"…...

2026/4/23 19:13:35 阅读更多 →

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全图解实战）一、前言二、列出 ES 所有索引：整体流程流程图三、Elasticsearch 列出所有索引：核心命令3.1 方法1：_cat/indices（最常用、运维…...

2026/4/23 19:13:36 阅读更多 →

SAP PI/PO HTTPS接口调用实战：从SSL证书导入到彻底告别iaik.security.ssl.SSLCertificateException

1. 当SAP PI/PO遇到HTTPS接口报错时发生了什么？ 最近在帮客户调试SAP PI系统调用外部HTTPS接口时，遇到了一个让人头疼的问题。系统在调用Swagger Petstore的API时，控制台突然抛出"iaik.security.ssl.SSLCertificateException: Peer cert…...

2026/4/23 15:04:11 阅读更多 →