一句话Claude Code 作为大脑MinerUopendatalab/MinerU60k stars作为文档理解层ip-publisher 作为内容生产与发布层——三者组合构建一个真正可以无人值守运行的内容 Agent。背景为什么AI 写作还是很费人力大多数人用 AI 做内容的现实手动找资料手动粘贴进 ChatGPTAI 生成 → 手动润色手动复制到各平台手动调格式、上传图片手动发布→ 省了 30% 的时间但还是很累真正的自动化应该是这样的触发词 / 定时任务Agent 自动找今天热点Agent 调用 MinerU 解析相关文档Agent 基于你的人设生成文章Agent 自动发布到小红书 / 知乎 / 公众号完成不需要人在一、三层架构拆解层级工具职责核心能力大脑层Claude Code理解意图、编排工具调用上下文理解、工具链编排、质量判断知识层MinerU文档 → 结构化知识84语言OCR、公式/表格/多栏完美还原发布层ip-publisher生成 → 适配 → 发布热点抓取、人设改写、多平台发布二、搭建步骤完整可复现Step 1安装三个工具# MinerU文档解析pipinstallmineru mineru--version# MinerU 2.5-Pro# ip-publisher内容生产与发布gitclone https://github.com/veeicwgy/ip-publishercdip-publisherpipinstall-e.ip-publisher init# 生成 ~/.ip-publisher/profile.yamlStep 2配置个人人设# ~/.ip-publisher/profile.yamlprofile: name:你的名字occupation:AI 工程师 / 开源开发者writing_style:技术深度 人话表达不装逼有干货domains: -AI工具-开源项目-LLM应用-文档处理platforms: zhihu: enabled:truestyle:分析型长文有数据支撑结构清晰xiaohongshu: enabled:truestyle:情绪化有冲击感的数字适合种草csdn: enabled:truestyle:代码为主技术深度优先# 关键指向 MinerU 解析的知识库knowledge_base: path:~/.ip-publisher/knowledge/auto_inject:trueStep 3配置 Claude Code MCP{mcpServers:{mineru:{command:uvx,args:[mineru-mcp],env:{MINERU_TOKEN:your_mineru_api_token}},ip-publisher:{command:python,args:[-m,ip_publisher.mcp_server],env:{PROFILE_PATH:~/.ip-publisher/profile.yaml}}}}Step 4运行完整工作流# 方式一手动触发指定文档claude读取 ./reports/mineru_paper.pdf结合今天 AI 领域热点 按我的人设写一篇知乎深度文章并发布# 方式二定时任务全自动每天 9 点# crontab -e09* * * claude抓取今日热点从知识库选最相关内容生成并发布三平台文章三、关键代码MinerU 解析结果如何注入文章生成3.1 知识提取器# knowledge_extractor.pyimportsubprocessimportjson from pathlibimportPath from anthropicimportAnthropic def extract_publishable_knowledge(pdf_path: str)-dict: 从 PDF 提取适合发布的结构化知识 Returns: headline_data: 标题级数字/结论 key_tables: 对比表格 core_conclusions: 核心结论3-5 条 unique_insights: 独家信息点 code_examples: 代码示例 citations: 可引用权威表述 output_dirPath(f/tmp/mineru_{Path(pdf_path).stem})output_dir.mkdir(exist_okTrue)subprocess.run([mineru,-p, pdf_path,-o, str(output_dir),--mode,precision,--lang,ch],checkTrue)md_fileslist(output_dir.glob(*.md))with open(md_files[0])as f: contentf.read()clientAnthropic()responseclient.messages.create(modelclaude-sonnet-4-5,max_tokens3000,messages[{role:user,content:f从这篇文档中提取适合内容创作的知识以 JSON 格式返回{{headline_data:[最震撼的数字/结论适合做标题],key_tables:[重要对比表格的 Markdown 格式],core_conclusions:[核心结论1,核心结论2,核心结论3],unique_insights:[只有这篇文档有、网上没有的独家信息],code_examples:[代码片段如有],citations:[可引用的权威表述带来源]}}文档内容前8000字{content[:8000]}}])returnjson.loads(response.content[0].text)3.2 与 ip-publisher 的集成适配器# mineru_ippublisher_bridge.pyimportyaml from knowledge_extractorimportextract_publishable_knowledge def prepare_article_context(pdf_path: str, hot_topic: str, platform: str)-str:组合 MinerU 知识 热点 → 生成文章 prompt with open(~/.ip-publisher/profile.yaml)as f: profileyaml.safe_load(f)knowledgeextract_publishable_knowledge(pdf_path)platform_styles{zhihu:深度分析有数据支撑结构化观点字数 1500-3000,xiaohongshu:情绪化表达突出冲击感数字口语化加emoji字数 300-800,csdn:代码为主有完整可运行示例技术术语准确字数 2000-4000,wechat:叙事型有故事感引导分享字数 1000-2000}returnf 你是一个{profile[profile][occupation]}风格{profile[profile][writing_style]}今日热点{hot_topic}从专业文档提取的知识 - 标题级数据{knowledge[headline_data]}- 核心结论{knowledge[core_conclusions]}- 独家信息{knowledge[unique_insights]}- 对比表格{knowledge[key_tables]}请结合热点和上述知识写一篇{platform_styles[platform]}的文章。 所有数据必须来自上面提供的知识不要编造。四、这套工具链能做什么不能做什么✅ 适合的场景每周读行业研报 → 产出知乎长文 ⭐⭐⭐⭐⭐AI 论文 → 技术科普文 ⭐⭐⭐⭐⭐产品发布会 PDF → 多平台评测 ⭐⭐⭐⭐政策文件 → 解读文章 ⭐⭐⭐⭐竞品分析报告 → 对比内容 ⭐⭐⭐⭐❌ 不适合的场景纯评论类内容无文档来源→ 直接用 ip-publisher 即可视频内容脚本 → ip-publisher 当前不支持视频平台需要实时数据的内容 → MinerU 处理静态文档不适合实时行情五、快速开始# 三分钟跑通最小 demopipinstallminerugitclone https://github.com/veeicwgy/ip-publishercdip-publisher pipinstall-e.ip-publisher init# 测试解析mineru-ptest.pdf-o./outputcat./output/*.md|head-100# 测试发布dry-run 模式不实际发布ip-publisher generate--source./output/*.md--platformzhihu --dry-run相关链接MinerU 开源版github.com/opendatalab/MinerU60k starsApache 2.0MinerU SaaS APImineru.netpip install mineru-open-sdkip-publishergithub.com/veeicwgy/ip-publisher快速增长中 MinerU 论文arXiv:2604.04771