宝子们好这里是AIWritePaper官方账号~这两天Anthropic的动作有点密集。Claude Sonnet 5 发布直接进入Free和Pro的默认模型位置也同步出现在Claude Code和Claude Platform。官方给它的关键词是agentic它能制定计划能调用浏览器和终端能把过去需要更大模型才能撑住的多步骤任务继续往前推。Claude Science也开始公测。它不是一个新聊天框而是面向科学家的AI workbench。它能接入科研人员常用的数据库、代码环境、计算资源和专业工具也能把图表、手稿、代码和审查记录放在一起。再加上额度重置以及Fable 5限时返场这几条消息放在一起看Anthropic想做的已经很清楚模型已经准备进入研究流程。以前我们问 AI能不能帮我写一段综述现在更该问的是能不能把文献、证据、图表、代码、引用和审稿意见放进同一个可追溯流程里Claude Science把结构、生物信息、图表和分析工作放在同一个科研界面里。这件事对于学术人来说比又多一个大模型更值得认真看。一、Claude Science 从“帮我写”到“一起验证”Claude Science目前开放测试Mac和Linux版本已经上线只是安装后是一个localhost的web服务。。。有点草率了。。跟分享的应用画风不是很一致。。要不是设置里那几个安装完成后需要预先配置的生信方向的skills。我真以为只是个本地服务套上了个claude的ui接了个中转的api。。Claude Science的官方定位是给科学家的AI workbench。这个词比chat更准确。由于今天又刷新了一下额度。。小编把5小时额度给干没了。。晚点测试一下这货的真实能力到底如何。而且有个很大的问题。。它有sonnet 5但是没有fable。。说白了workbench应该更像实验台。材料放在哪里工具怎么调用计算在哪里跑图表怎么生成结果如何复现哪一步需要人批准哪一步可以交给机器执行都要有位置。传统学术写作通常很碎。文献在Zotero笔记在Obsidian数据在Excel或R图表在Python脚本里论文正文在Word修改意见散在邮件和批注里。Claude/Codex加进来以后很多人只是多开了一个聊天窗口让它帮忙概括文献、改写段落、润色摘要。问题也出在这里聊天窗口能生成文字却很难天然保留证据链。Claude Science需要解决的是每个输出都带有生成历史、代码环境、输入说明和对话记录。图表不是只给一张图片而是连同生成代码和环境一起交给你。手稿不是只给一段文字而是可以沿着来源、计算、图表和修改记录回头检查。学术写作里的 workbench至少要留下四条线索放到论文写作里这个提醒很实用。AI辅助论文不能只追求段落顺而要把“为什么这么写”保留下来。一段文献综述最好能追到原始论文。一个数字最好能追到数据表或计算脚本。一张图最好能追到绘图代码。总结出来的内容最好能知道它来自哪组证据而不是来自模型的顺手补全。看看官方配图。。和目前的beta版区别贼大。。可复现artifact的关键在于图表、代码、环境和修改意见同时存在不只是导出一张漂亮图片。写得像论文只是表面。经得起回看才是学术写作真正需要的能力。二、Sonnet 5 适合日常学术任务的执行层Sonnet 5这次发布有一个定位很适合普通学术写作者它不是被包装成最顶级模型而是被放在性价比和执行能力的位置上。官方说Sonnet 5在推理、工具调用、编码和知识工作上明显强于Sonnet 4.6部分高effort场景可以接近 Opus 4.8同时价格更低。发布初期的API价格是每百万输入 token 2 美元、输出 10 美元8 月 31日后恢复到输入 3 美元、输出 15 美元。这个定价逻辑说明它更像日常任务的主力模型。Sonnet 5 的价值不在于取代所有高阶模型而在于用更合适的成本覆盖大量日常知识工作。学术写作里有大量任务并不需要最贵模型但很需要一个稳定执行层。比如整理材料。把一批文献按研究对象、方法、样本、核心发现、局限整理成表格这件事不炫技但很耗时间。模型需要耐心、格式稳定、不要漏列。再比如推进结构。根据研究问题生成章节接口表检查绪论是否导出了研究缺口判断方法章节能不能回答研究问题。这类任务需要推理但更需要按流程做完而不是给两句空泛建议。还有代码和图表。现在很多论文都绕不开数据处理、可视化和格式转换。Sonnet 5 更强的工具调用和终端能力适合处理清洗表格、生成初版图表、检查脚本错误、把图注和图表逻辑对应起来。局部审稿也适合放在这一层。让它只检查一个小节有没有概念跳跃、引用是否对应、段落是否堆砌。这种任务不值得每次都调用最贵模型但确实需要一个不容易半途而废的助手。所以Sonnet 5 对学术写作的意义不是替你写完论文而是把那些低到中高难度的研究杂活稳定接住。你给它边界和材料它帮你把流程往前推。三、Fable 5 适合长周期难题Fable 5重新开放以后很容易让人产生一个误解既然它更强写论文是不是就应该直接上Fable不一定。Anthropic对Fable 5的定位是高难度知识工作、长周期项目和复杂agent任务。官方页面提到它适合多阶段任务、长时间推进、自我检查、代理协作。换句话说Fable 5是为了处理那些普通模型会中途失焦、漏掉约束、无法持续维护上下文的大任务。任务类型更适合的模型位置原因文献矩阵、摘要整理、局部润色、图表脚本修错Sonnet 5执行稳定、成本更合适不需要每次动用最高阶模型。长篇综述规划、跨材料论证、多 Agent 审稿Fable 5更适合长周期、多阶段、需要自我检查和持续上下文的任务。科研数据、代码、图表、文稿、计算资源打通Claude Science / 工作台范式关键不只是模型强而是能把工具、记录、复现和审查串起来。一篇长篇综述如果要处理上千篇文献需要做摘要以及提取核心主张、关键证据、量化结论、争议点和研究脉络再构建可审查的叙事框架这类任务更接近Fable 5的应用场景。一篇跨材料论文如果同时有访谈、问卷、公开数据和政策文本需要把不同材料对应到不同研究问题并检查结论有没有超过证据范围也更适合交给更强的长周期模型协助规划。多轮深度审稿也是类似场景。方法审稿、理论审稿、证据审稿、语言审稿不同视角反复检查同一份论文规划。这里的价值不是生成更多文字而是让漏洞暴露出来。但如果只是改摘要、调语序、写一封投稿邮件大概率是浪费。学术写作里最常见的问题不是模型不够强而是任务没有拆开证据没有准备好完成标准没有写清楚。拿更强模型去处理模糊任务只会得到更高级的模糊输出。更合理的分工是Sonnet 5做日常推进Fable 5做少数长周期难题Claude Science这类工作台负责把材料、工具、计算和审查串起来。四、Claude Science多Agent 综述写作Claude Science的案例里最值得学术写作者认真看的是Allen Institute神经科学家Jérôme Lecoq的长篇综述流程。这个案例的关键设计是把综述拆成一套计算流程子Agent阅读大量论文提取中心论点和关键量化发现存入evidence state database流程再构建叙事弧线按章节分配给不同子Agent每个章节内部还会从证据库生成跨研究的量化图表。它使用了actor-critic pairs一个 Agent 负责生成内容另一个独立的reviewer agent 检查准确性和引用保真。这才是 AI 辅助学术写作真正高级的地方先做证据库再做叙事先抽取可核查事实再生成章节先有 reviewer agent再进入终稿。很多宝子们现在用AI写综述流程大概是题目丢进去让模型列大纲再逐节扩写快交稿时人工补几个引用。这个流程看起来快但证据状态不可控。模型写到哪里证据跟到哪里常常说不清。Lecoq这个案例提供了另一种做法先做证据库再做叙事先抽取可核查事实再生成章节先有 reviewer agent再进入终稿。Reviewer agent 的意义不是替你写得更像论文而是把引用、计算和证据错误提前拦下来。普通学术写作者未必需要Claude Science也未必能处理上千篇论文。但可以搭一个轻量版。先把文献做成证据表。每篇文献至少记录研究对象、方法、样本、核心发现、关键数字、局限和可引用位置。再把观点挂到证据上。每个想写进论文的判断都要对应一条或多条证据。挂不上去的判断先不要写进正文。生成章节时不让模型自由发挥背景知识只允许它使用证据表里的内容。完成后另起一次reviewer pass只检查引用是否对应、结论是否越界、有没有把相关关系写成因果。收口时还是人来判断。AI可以帮你发现问题但论文的责任不能外包。这套流程不需要神奇提示词却更接近真正的学术写作。五、Claude Science 能把你的论文变成一个小型 workbench不是每个人都在做蛋白质结构预测也不是每篇论文都需要 HPC 集群。Claude Science 看起来离普通文科、教育学、管理学论文很远但它背后的工作台逻辑其实很通用。科研工作台的另一层价值是把本地环境、远程计算、代码执行和结果回收接到同一条链路里。一篇论文可以拆出的四个工作区。这样一来AI的角色会清楚很多它不是论文作者而是材料整理员、结构助理、初稿生成器和审稿助手。研究问题怎么定义证据边界怎么守最终结论能说到哪里仍然是人的责任。Claude Science 给普通写作者的提醒也在这里别再只问模型会不会写开始设计它在研究流程里应该站在哪个位置。六、把这套思路落地从一张研究任务卡开始如果想把上面的思路落到自己的论文里不必一上来搭一个复杂系统。先从一张研究任务卡开始。这张卡片要写清楚几件事研究对象是谁研究问题是什么手里有哪些材料暂时不讨论什么结论最多能推到哪里。只要这几行写不清后面的大纲再漂亮也只是模型在替你补空白。接着做文献矩阵可以让Claude/Codex帮你整理可以但表格字段要可检查作者、年份、对象、方法、核心发现、关键证据、可用章节、不能推出的结论。末尾那一列很重要它能提醒你不要把材料往外推得太远。文献矩阵之后再做证据地图。把准备写进论文的判断逐条列出来让 AI 帮你匹配证据。没有证据支撑的判断单独标为待补材料。不要急着把它润色进正文。等证据地图稳定再写章节接口。绪论要交出研究问题文献综述要交出研究缺口方法章节要交出可执行路径分析章节要交出被证据支持的解释结论章节只能交出有限回答。模型分工也可以在这个阶段定下来。日常整理、局部改写、图表脚本和小节检查用Sonnet 5这类执行层模型就够。长篇综述、跨材料论证、多Agent审稿再考虑Fable 5或更高阶模型。不是所有任务都需要最贵模型也不是所有任务都应该压成一个prompt。生成之后最好另起一个对话做独立审查。只查引用是否对应数字是否可追溯结论是否越界概念有没有混用是否出现没有来源的“已有研究表明”。还有一件事容易被忽略就是保留记录。重要提示词、版本变化、数据处理代码、图表生成脚本和人工修改记录都值得留下来。它们不是形式主义而是答辩、投稿、返修和复现时的底气。这套流程的目标不是让论文AI味太重而是让论文重新回到研究本身。AI可以提速但每一步都要留下痕迹。七、收束一下AI 学术写作的下一阶段是“可审计的协作”Claude Science、Sonnet 5、Fable 5 放在一起看会出现一个很清晰的方向。模型会继续变强但真正改变学术写作的不只是更强的生成能力而是更完整的协作机制能接工具能跑代码能调计算资源能生成图表能保留历史也能让 reviewer agent 检查引用和计算。这会把学术写作从“Claude/Codex帮我写一段”推向“Claude/Codex帮我维护一个研究系统”。但这不意味着研究者可以退场。模型越强研究者越要清楚自己负责什么定义问题、选择材料、确认方法、判断证据、守住结论边界。开题时Claude/Codex可以帮你把题目压窄不能替你决定什么问题值得研究。写综述时Claude/Codex可以帮你整理文献不能替你判断哪些争议真正构成缺口。做图表时Claude/Codex可以帮你改代码、调样式不能替你确认口径是否合理。返修时Claude/Codex可以帮你拆审稿意见不能替你承担结论的学术责任。以后真正会用 AI 写论文的人可能不是最会写 prompt 的人而是最会搭工作台的人。他的文献不是散的证据不是飘的图表不是孤立的引用不是补上去的审稿也不是临交稿才想起来的。Claude/Codex负责把流程跑起来研究者负责让流程站得住。