新版本 OceanBase seekdb 1.3.0：22倍性能增益，P99抖动小于1.1倍

张

张建站

2026/6/6 21:33:32

10分钟阅读

新版本 OceanBase seekdb 1.3.0：22倍性能增益，P99抖动小于1.1倍

Agent 的真实负载是 streaming workload——大多数向量数据库不是为它设计的。如果你正在为 Agent 选向量数据库大概率参考的是 ann-benchmarks 或者各家官方发的性能对比。那些测试跑的是这样的负载先批量导入全部数据建好索引再做只读查询。这不是 Agent 的负载Agent 的真实负载是这样的for step in agent.run(): memory.write(step.observation) # 持续写入 relevant memory.search(step.query) # 毫秒后检索写入和检索同时发生间隔是毫秒级而且是并发的。这套负载有个名字——streaming workload。VectorDBBench 专门为此设计了 StreamingPerformanceCase固定速率持续写入并发查询跟生产环境的 Agent 一模一样。VectorDBBench 由 ZillizMilvus 背后的公司维护是一个第三方开源 benchmark 框架。我们用它测了 6 款主流向量数据库。一个被忽略的指标并发下你的 P99 会涨多少测试条件Cohere 10M 数据集768 维16 vCPU / 64 GiB统一 HNSW 索引参数M16 / ef_construction256 / ef_search200持续写入 500 行/秒。大多数人看 benchmark 只看 QPS 和串行延迟。但 Agent 在生产环境里不是单线程运行的。真正决定你 SLA 的是并发 P99——以及它在并发加大后涨了多少倍。看图里“P99 Jitter”那组ES10.3 倍——串行 P99 只有 5.2ms比 OceanBase seekdb 快但并发一开就涨到 53.6ms某向量数据库 A9.7 倍——串行 15.9ms并发直接飙到 153.6msOceanBase seekdb1.1 倍——从 19.7ms 到 21.7ms几乎不动这不是参数调优的问题——是架构问题。下一节详细解释。※ 完整测试脚本和配置github.com/oceanbase/vdb-streambench欢迎提 PR 补充更多产品。为什么 streaming 负载下 P99 会炸向量数据库 A、B、D 在它们擅长的场景批量导入只读查询下表现优秀——它们本来就是为那个场景设计的。但 streaming 写入会暴露一个结构性的问题不断产生新的 segment。查询时需要 fanout 到 N 个 segment 分别做 knn 再合并结果。单线程下勉强可控并发一上来N 个 segment × M 个查询线程在 CPU 上互相争抢P99 就会飙升。大多数向量数据库的索引段数量会随 streaming 写入膨胀并发查询的争抢越来越严重。OceanBase seekdb 的索引数量是固定的永远只有两个所以不会。具体来说OceanBase seekdb 1.3.0 为 streaming 负载设计了两个机制第一写入路径不碰索引。事务提交后只写 redo log 就返回。一条独立的 Change Stream 管道在后台异步消费 redo log把向量写入内存中的 delta HNSW 索引。写入和索引构建物理上完全解耦——写入不会被索引构建阻塞。第二查询路径固定只走两个索引。OceanBase seekdb 维护一个 delta HNSW增量层接收新写入和一个 snapshot HNSW主存量层类似 LSM-Tree 的分层思路。查询时对两个索引各做一次 knn search 再合并结果——不管写入了多少数据索引数量不膨胀并发查询不争抢。我们自己踩过这个坑。图里 OceanBase seekdb 1.2.0 那组——69 QPS、并发 P99 410ms——就是我们在做架构重写之前的成绩。旧版本的写入路径会同步构建索引跟上面说的传统架构是同一个问题。重写后同一个产品22 倍 QPS、19 倍延迟的改善全部来自这两个机制。Agent 需要的不只是快——还需要后悔药性能讲完了。但做过 Agent 的人都知道还有一个痛点Agent 需要试探性地修改数据改 memory、跑实验、可能写坏表你需要一个安全的沙箱和回滚机制。大多数向量数据库没有这个概念。OceanBase seekdb 直接在内核实现了 Copy-on-Write-- 秒级快照不复制数据 FORK DATABASE agent_state TO sandbox_42; -- Agent 在沙箱里随便折腾 USE sandbox_42; INSERT INTO memory(embedding, content)VALUES([0.1,...], new observation); -- 试探成功 → merge 回主线 MERGE TABLE sandbox_42.memory INTO agent_state.memory STRATEGY THEIRS; -- 试探失败 → 扔掉主线不受影响 DROP DATABASE sandbox_42;这是内核级 COW不是应用层的 snapshot/restore。fork 秒级完成不复制数据每个沙箱是完整可写的数据库表结构、向量索引、自增列全部正常。三种冲突策略FAIL / THEIRS / OURS让你精确控制 Agent 的修改有多少可以被信任。同时支持 FORK DATABASE 和 FORK TABLE 两种粒度。一条 SQL 完成混合检索Agent 的检索通常不是纯向量相似度。你可能需要同时过滤作者、时间范围再加上全文匹配。在OceanBase seekdb 里这是一条 SQL 的事SELECT id, title, l2_distance(emb, [0.12,0.34,...]) AS dist FROM docs WHERE MATCH(content)AGAINST(quarterly report) AND author_id 42 AND created_at 2026-01-01 ORDER BY dist APPROXIMATE LIMIT 10;向量全文标量过滤在同一个执行计划里下推不需要客户端拼装多次查询结果。完整 MySQL 协议兼容LangChain / LlamaIndex / Dify / 任何 MySQL 客户端直接对接。30 秒试一下pip install -U pyseekdbimport pyseekdb client pyseekdb.Client(path./agent_state.db) memory client.get_or_create_collection(nameepisodic) # 第一轮写入 Agent 观察 memory.upsert( ids[1, 2, 3], documents[ user prefers dark mode, user speaks English and Chinese, user timezone is UTC8, ], ) memory.refresh_index() results memory.query(query_textsui preferences?, n_results1) print(results[documents]) # - [[user prefers dark mode]] # 第二轮写入新观察刷新索引后立即可查 memory.upsert(ids[4], documents[user saw pricing page 3 times today]) memory.refresh_index() results memory.query(query_textspurchase intent signals, n_results1) print(results[documents]) # - [[user saw pricing page 3 times today]]无需 server无需 schema嵌入式模式在进程内运行。写入走异步索引管道和 server 模式相同的架构需要立即查询时调一次 refresh_index() 确保索引就绪。切换到 server 或分布式模式只需改一行连接参数。也可以用 Cloud 免安装试用免注册免费 7 天一个 curl。关于 OceanBase seekdbOceanBase seekdb 完全开源Apache 2.0由 OceanBase 团队开发。你可能已经在用 OceanBase 了——它跑在支付宝、淘宝、滴滴、小米等公司的生产环境里。OceanBase seekdb 继承了同一套存储引擎和 SQL 执行器专注于 Agent 场景的向量关系型混合负载——开源半年已有 2,500 GitHub starLangChain / LlamaIndex / Dify / Coze 等主流框架均已集成。如果你正在为 Agent 选数据库——花 30 秒跑一下上面的 demo。⭐github.com/oceanbase/seekdb — 一个 star 让更多人发现这个项目也让我们有动力继续投入。遇到问题或想讨论你的 Agent 场景GitHub Issues · GitHub Discussions

C#调用Bartender打印标签？试试导出为图片或PDF，实现无打印机调试与存档

C#调用Bartender实现标签无打印机调试与电子存档全攻略在工业自动化、物流管理和生产制造领域，标签打印是日常工作流程中不可或缺的一环。Bartender作为行业领先的标签设计和打印软件，其强大的功能与灵活的API接口为开发者提供了丰富的集成可能性。然而&…...

2026/6/6 21:21:31 阅读更多 →

跨学科研究新思路：怎么用 GPT-5.5 寻找不同领域之间的学术交叉点？（附实战教程）

在当前的学术界，“跨学科（Interdisciplinary）”已经成为申报科研项目和发表高水平顶刊的“流量密码”。然而，想要跨越专业壁垒并不容易，学者们往往受限于自身的知识孤岛。为了打破这种思维局限，许多青年学者…...

2026/6/6 21:19:56 阅读更多 →

新手友好：在快马平台动手实现第一个代码转图片网页应用

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请创建一个适合编程新手学习的代码转图片示例页面。要求功能简单明确：一个文本框用于输入代码，一个下拉菜单选择语言，一个按钮点击后&#xff0…...

2026/6/6 21:19:31 阅读更多 →

Windows防撤回终极指南：如何永久保存微信QQ撤回消息

Windows防撤回终极指南：如何永久保存微信QQ撤回消息【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/…...

2026/6/6 12:13:44 阅读更多 →

终极视频下载解决方案：VideoDownloadHelper 完全指南

终极视频下载解决方案：VideoDownloadHelper 完全指南【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网络上的精彩…...

2026/6/6 11:10:45 阅读更多 →

小微企业合作网络与成长预测解析方案【附代码】

✨ 长期致力于小微企业、合作网络、网络结构、企业成长、成长预测研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于提名生成法的合作网络构建与结构…...

2026/6/6 12:08:39 阅读更多 →

终极键盘映射工具：如何免费解决游戏按键冲突问题

终极键盘映射工具：如何免费解决游戏按键冲突问题【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏中因为同时按下左右方向键而让角色卡顿不前？是否在关键时刻因为按键…...

2026/6/6 10:41:39 阅读更多 →