GraphRAG也能玩Skill，西交大知识超图起飞

张

张建站

2026/5/21 22:10:09

10分钟阅读

你让一个大模型从医学文献里抽知识图谱它常常漏掉关键的时空限定换到法律文书它又开始把一个完整事件拆成一堆零散的三元组。换个领域就拉跨这不是个例而是现有知识抽取方法的通病。问题不是模型笨而是它在不同领域面前缺的不是知识而是一套怎么抽的技能。Hyper-KGGen就是为了解决这个问题来的。知识图谱的单薄和超图方法的头重脚轻传统知识图谱只存三元组——(头实体, 关系, 尾实体)但现实中大量事实天然是多元的。比如2024 年 3 月甲公司在上海收购了乙公司这不是一个三元组能装下的涉及时间、地点、两个实体和具体动作至少是五元关系。硬拆成多个三元组语义就散了。知识超图可以解决这个问题——它把一组相关实体和关系打包成一个超边保留完整语义。但现有超图抽取方法普遍有两个毛病一是头重脚轻只盯着复杂的高阶关系基础二元关系反而抓不好二是跨域拉跨通用抽取器遇到行业术语和隐含逻辑就大幅掉分。Scenario Gap 对比通用 prompt vs 领域自适应 prompt 的抽取效果差异Figure 1 很直观地展示了这个 gap同一个模型用通用 prompt 抽取效果差但换上领域自适应的 prompt 就好很多。说明模型不是不会而是缺少对齐领域约束的Skill技能。Hyper-KGGen 怎么做先搭骨架再练技能Hyper-KGGen的核心思路是两步闭环Hyper-KGGen 整体架构左侧粗到细抽取右侧自适应Skill获取第一步粗到细分层抽取。先抽二元关系搭骨架再加时空限定条件丰富细节最后才抽多元事件做完整超边。模型每一步的认知负担小结构也更完整。第二步也是这篇论文最关键的创新——把失败变成技能库。具体做法对同一文档并行抽 K 次按稳定性把结果分成三类稳定集每次都抽到的属于通用知识不用管不稳定集有时抽到有时漏掉的属于领域特定知识遗漏集完全没抽到的属于领域盲区对不稳定的关系分析成功轨迹里的推理路径总结出为什么会抽对——这叫路径归纳。对完全漏掉的关系把正确答案塞回上下文让模型反推应该怎么发现这条关系——这叫事后推理。这些总结出来的经验被提炼成技能存进一个全局Skill技能库。推理时系统会从技能库里检索相关技能动态注入 prompt让模型带着前人经验去抽取新文档。Skill技能库的维护也很有讲究——不是只进不出而是通过 ADD新增、MODIFY修正、MERGE合并冗余、KEEP保持不变四个操作持续进化避免过度拟合。效果Skill技能比示例有效得多数字说话n-ary 关系抽取HyperDocREDHyper-KGGen 的 Micro F1 达到0.5600是 HyperGraphRAG0.1675的3.3 倍。加了技能库之后recall 从 0.314 提升到0.430而 precision 只从 0.833 降到 0.802——用很小的精度代价换来了大量被遗漏关系的发现。PR 曲线Hyper-KGGen 在不同语义匹配阈值下全面领先跨域事实覆盖MINE在 4 个不同底层 LLMGPT-4o-mini、Gemini-2.5-Flash、Qwen3、DeepSeek-V3.2上Hyper-KGGen 的平均事实覆盖准确率约0.80比 Cog-RAG~0.73和 Hyper-RAG~0.74高约7 个百分点。说明技能库的增益不依赖特定模型。Figure 4: Distribution of MINE scores across 100 articles for KGGen, Cog-RAG, and Hyper-KGGen.RAG 下游任务UltraDomain在 Mix 和 Pathology 两个基准上Hyper-KGGen 的平均分分别为85.10和86.72均为所有方法最高。即使在较少检索量k40下Hyper-KGGen 的表现就能匹配 Hyper-RAG 在k80时的水平——意味着它构建的超图信息密度更高检索效率更好。最关键的对比在 Figure 5SKill vs Few-shot。Few-shot 示例加到一定数量就饱和了因为示例主要帮模型对齐格式和局部规律但技能是从跨场景失败模式中总结的决策规则能持续积累且领域切换时仍然有效。Skills vs Few-shot技能库持续累积增益few-shot 示例很快饱和这意味着什么Hyper-KGGen 证明了一件事在知识抽取场景下从失败中提炼的可复用技能比喂更多示例有效得多。这个思路不限于知识图谱。任何需要 agent 在多场景下持续改进的 workflow——文档分析、信息抽取、自动化决策——都可以借鉴这种稳定性反馈技能进化的范式让模型跑多遍找到它不稳定和完全遗漏的地方从中提炼规则反哺下一次执行。模型不是不会做而是缺一套方法。给例子不如教技能。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Amphenol ICC DRPC51A009A40线束组件详解与替代方案

在现代电子设备设计中，高质量的线束线缆组件对于系统的稳定性和可靠性起着至关重要的作用。Amphenol ICC（Commercial Products）作为全球知名的互连解决方案供应商，其产品在工业、通信、汽车等领域都有广泛应用。今天，我…...

2026/5/21 22:09:09 阅读更多 →

双榜第一！文心5.1登顶中文创意写作综合实力评测

【大力财经】5月18日，全球权威ICT领域市场研究机构Omdia发布《2026 年基础模型中文创意写作能力评估》报告，围绕中文创意写作七大核心维度，对 DeepSeek V4、文心5.1（ERNIE 5.1）、GPT 5.5 等 8大国内外主流顶级文本模型…...

2026/5/21 22:00:44 阅读更多 →

Midjourney金属质感渲染实战手册（航天级铝钛合金/做旧铜锈/镜面不锈钢三重进阶）

更多请点击： https://intelliparadigm.com 第一章：Midjourney金属质感渲染的核心原理与演进脉络金属质感在AI图像生成中属于高阶视觉建模任务，其本质依赖于对微观表面结构、镜面反射路径与环境光交互的隐式学习。Midjourney自V5起引入更精细…...

2026/5/21 21:58:38 阅读更多 →

免费API宝藏库：开发者必备的Public APIs完全指南 [特殊字符]

免费API宝藏库：开发者必备的Public APIs完全指南 🚀 【免费下载链接】public-apis A collective list of free APIs 项目地址: https://gitcode.com/GitHub_Trending/pu/public-apis 还在为寻找可靠API而烦恼吗？Public APIs项目为你准…...

2026/5/21 4:09:25 阅读更多 →