AI Agent在旅游规划中的个性化服务

张

张建站

2026/5/26 11:36:13

10分钟阅读

AI Agent在旅游规划中的个性化服务：从概念到落地的全栈实战指南目标读者有一定Web开发基础（React/Vue、API调用、数据库CRUD），了解Python数据处理/机器学习入门知识，对LangChain/大语言模型（LLM）Agent概念有初步接触，同时对旅游科技（TravelTech）赛道感兴趣，希望自己动手搭建一个可落地的、具备基础个性化能力的旅游规划小产品，或者优化现有产品的推荐/规划模块的初级全栈/前端转AI/后端转AI的开发者。标题选项从零到一：用LangChain + 高德地图API + LLM 构建你的第一个个性化AI旅游规划Agent旅游科技破局：AI Agent如何解决传统OTA“千人一面”的旅游推荐痛点？从“被动推荐”到“主动规划”：全栈开发一个懂你行程节奏、偏好的旅游AI AgentLangChain实战系列：个性化旅游规划Agent的架构设计、核心实现与性能优化告别无效行程表！手把手教你用GPT-4o mini + 实时数据API打造自适应旅游助手引言 (Introduction)痛点引入 (Hook)各位开发者小伙伴，或者作为普通游客的你，有没有过这样的糟糕经历？打开某OTA（在线旅游平台），输入“3天2晚上海亲子游”，弹出来的前10篇行程攻略，标题差不多、景点都是外滩迪士尼陆家嘴老城隍庙豫园四件套、时间安排要么赶得像军训要么闲得发慌、完全不考虑你的预算是8000还是3000、娃是3岁怕走路还是10岁爱冒险、你是喜欢历史人文打卡还是小众咖啡馆探店；好不容易翻到一篇“看似小众”的，点进去一看，餐厅推荐都是软文植入、交通时间写的是“大概20分钟”但高德导航实际显示45分钟（含早高峰堵车）、住宿离市中心超远但没标通勤方式；更气人的是，你明明勾选了“避免排队、优先地铁、人均200以下餐厅”，推荐结果还是该排队排队、该打车打车、餐厅人均300+起步……对，这就是传统旅游规划系统的三大核心痛点：“千人一面”的静态/半静态推荐逻辑：大多基于协同过滤（CF）、内容过滤（CB）等经典推荐算法，或者是运营小编手动维护的“模板库”，只能捕捉“大众共性”，无法捕捉“用户个性的细粒度差异”——比如你是摄影爱好者，它不知道你要凌晨5点去外滩抢机位；你是素食主义者，它不会提前筛选素食餐厅；缺乏实时数据的动态适配能力：传统行程表大多是“离线生成”的，不会考虑实时天气、实时景区人流量、实时公共交通延误、实时餐厅等位时间、实时酒店空房价格这些影响旅游体验的关键动态因素；交互方式单一、规划效率低下：大多是“下拉菜单选条件 → 提交 → 等结果 → 不满意再改条件再提交”的线性交互，浪费大量时间，而且很难表达复杂的、模糊的个性化需求——比如“我想在苏州玩2天半，第一天下午2点到，最后一天晚上8点走，预算人均1500，喜欢逛老城区巷子里的小店，不要太商业化的平江路主街，最好有昆曲/评弹的小茶馆，交通以共享单车和地铁为主”，这种需求用下拉菜单根本选不完、说不清楚！那有没有什么办法能彻底解决这些痛点，打造一个真正“懂你、懂实时、懂规划”的旅游助手呢？答案是肯定的——就是本文的主角：AI Agent！文章内容概述 (What)本文将带你从基础概念讲起，到系统架构设计，再到核心功能的全栈代码实现，最后到性能优化和未来展望，手把手教你搭建一个具备细粒度个性化需求理解、实时数据动态适配、多轮对话式交互、自适应行程调整能力的轻量级AI旅游规划Agent。我们将用到以下主流、开源、免费（或有免费额度）的技术栈：大语言模型（LLM）层：OpenAI GPT-4o mini（理解能力强、推理速度快、价格便宜，是入门和小产品落地的首选）、LangChain（LLM应用开发框架，帮我们快速构建Agent）；实时数据层：高德地图开放平台（API免费额度大、覆盖国内所有城市、数据更新及时——包括天气、景区人流、交通导航、POI搜索、餐厅/酒店信息等）、大众点评开放平台（可选，补充POI的真实评价、人均消费、等位时间等信息，本文会演示如何接入，但实际落地可能需要申请企业资质）；数据存储层：SQLite（轻量级、无需单独安装、适合小产品原型开发）、Redis（可选，用于缓存LLM的上下文和实时数据的高频查询结果，提升响应速度）；前端交互层：React + Ant Design（快速构建美观、易用的多轮对话式界面）；后端服务层：Python FastAPI（高性能、异步、自动生成API文档，非常适合AI应用的后端开发）。读者收益 (Why)读完本文并跟着动手实践，你将能够：深入理解AI Agent的核心概念、架构组成和工作原理——不再是只会用LangChain的“API调用工程师”，而是能从原理层面设计、优化Agent的开发者；掌握主流开源AI应用开发工具链的使用方法——包括LangChain的核心组件（Chain、Tool、Agent、Memory、Embedding）、高德地图开放平台的常用API、FastAPI的异步开发、React的多轮对话界面开发；独立完成一个可落地的轻量级个性化旅游规划Agent的全栈开发——具备细粒度需求理解、实时POI/天气/交通查询、行程自动生成/调整、预算自动计算、多轮对话交互等核心功能；了解AI Agent在旅游规划领域的最佳实践、性能优化技巧和未来发展趋势**——为你后续优化产品或进入TravelTech赛道打下坚实的基础。准备工作 (Prerequisites)技术栈/知识在开始之前，请确保你已经具备以下知识：Python基础：熟练掌握Python的基本语法、数据类型、函数、类、模块、异步编程（async/await）等；Web开发基础：前端：熟悉React的基本概念（组件、Props、State、Hooks）、HTTP请求（Axios/Fetch）；后端：了解RESTful API的设计规范、FastAPI的基本使用（或Flask/Django，但本文推荐FastAPI）；数据库基础：熟悉SQL的基本语法（SELECT、INSERT、UPDATE、DELETE）、SQLite的基本使用；AI/LLM基础：了解大语言模型的基本概念（Prompt Engineering、Token、Context Window等）；对LangChain有初步的了解（比如知道Chain是什么、Tool是什么，但不需要深入）；知道Embedding是什么（本文会简单解释，但不要求深入理解原理）。环境/工具请确保你已经安装了以下环境和工具：操作系统：Windows 10/11、macOS 10.15+、Linux（推荐Ubuntu 20.04+）；Python：Python 3.10+（本文使用Python 3.11，因为LangChain 0.2.x+推荐使用Python 3.10+）；Node.js：Node.js 18+、npm 9+ 或 yarn 1.22+（本文使用npm 10）；代码编辑器：VS Code（推荐）、PyCharm、WebStorm；API密钥：OpenAI API密钥（需要注册OpenAI账号，充值少量金额——GPT-4o mini的价格非常便宜，0.15美元/百万输入Token，0.6美元/百万输出Token，搭建原型和测试大概只需要1-2美元）；高德地图开放平台API密钥（需要注册高德开放平台账号，创建应用并申请Web服务API和Web端API——免费额度非常大，Web服务API每天100万次调用，POI搜索/天气查询/交通导航等常用API都包含在内，完全够原型开发和小范围测试使用）；大众点评开放平台API密钥（可选，需要申请企业资质，本文会提供模拟数据的代码，方便没有企业资质的小伙伴测试）。核心概念：AI Agent与个性化旅游规划在开始动手实战之前，我们需要先深入理解几个核心概念——这是后续设计架构、编写代码的基础。很多开发者刚开始做AI应用时，只会“复制粘贴LangChain的示例代码”，遇到问题就不知道怎么解决，根本原因就是没有从原理层面理解这些核心概念。1. 什么是AI Agent？1.1 问题背景在AI Agent出现之前，我们用LLM做应用主要有两种方式：单轮/多轮对话Chain：比如给LLM一个固定的Prompt模板，输入用户的问题，LLM直接输出答案——比如“写一篇100字的上海迪士尼亲子游攻略”，但这种方式只能处理静态的、不需要外部数据的、不需要复杂推理的问题；调用外部工具的增强Chain：比如给LLM加上一个POI搜索工具，输入用户的问题，先判断是否需要调用POI搜索工具，如果需要就调用，然后把搜索结果和用户的问题一起传给LLM，LLM再输出答案——比如“找上海静安区人均150以下的素食餐厅”，这种方式虽然能处理需要外部数据的问题，但推理能力有限，只能处理“单步决策”的问题，比如“先搜索POI，再生成答案”，或者“先搜索天气，再搜索POI，再生成答案”，但无法处理“多步、动态决策”的问题——比如“我想在上海玩3天，第一天下午2点到虹桥火车站，最后一天晚上8点走，预算人均2000，第一天下午下雨，第二天晴天，第三天阴天，喜欢逛博物馆和老城区巷子里的小店，不要商业化的景点，帮我规划一个合理的行程”——这种问题需要LLM根据实时天气动态调整行程安排、根据预算筛选POI、根据时间和交通导航计算行程的合理性、如果某个景点临时闭园或者人流量太大还要换备选景点、如果某个餐厅等位时间太长还要换备选餐厅，这是“单步决策”的增强Chain根本无法处理的。1.2 问题描述那我们需要一种什么样的AI模型/应用框架，才能处理这种**“多步、动态决策、需要外部数据、需要复杂推理”**的问题呢？1.3 问题解决答案就是AI Agent！1.4 核心概念定义关于AI Agent的定义，目前学术界和工业界还没有一个完全统一的标准，但LangChain的创始人Harrison Chase提出的“LLM + Memory + Tools + Planning”四要素模型是目前最主流、最被广泛接受的定义：AI Agent = 大语言模型（LLM，大脑） + 记忆（Memory，存储过去的交互信息） + 工具（Tools，连接外部世界） + 规划（Planning，复杂问题的拆解与决策）简单来说，AI Agent就像一个**“具备自主思考能力和行动能力的虚拟助手”**——你给它一个复杂的任务，它会：理解任务：用LLM的自然语言理解能力，拆解任务的目标、约束条件、优先级等；回忆过去：从Memory中提取过去的交互信息（比如用户之前说过的预算、偏好、过敏史等）；制定计划：用LLM的推理能力，制定一个完成任务的“多步行动计划”；执行行动：根据计划调用相应的Tools（比如搜索实时天气、搜索POI、计算交通导航时间等）；观察结果：观察Tools返回的结果；反思调整：用LLM的推理能力，反思结果是否符合预期，如果不符合预期（比如搜索到的餐厅人均消费超过预算、某个景点临时闭园、交通导航时间太长等），就调整计划，重新执行行动；输出最终结果：直到结果符合预期，就把最终结果（比如一个完整的、合理的行程表）输出给用户；存储记忆：把本次交互的信息（比如用户的新需求、生成的行程表、调整计划的原因等）存储到Memory中，以便下次交互使用。1.5 边界与外延1.5.1 AI Agent与增强Chain的区别很多开发者刚开始会混淆AI Agent和增强Chain，它们的核心区别在于决策方式的不同：增强Chain：决策方式是**“预定义的、静态的、单步/固定多步的”**——比如你预定义了“先搜索天气，再搜索POI，再生成答案”的流程，不管用户的问题是什么，都会按照这个固定的流程执行；AI Agent：决策方式是**“自主的、动态的、多步可调整的”**——比如你给它一个任务，它会自主决定“先做什么，再做什么，第三步做什么，第四步要不要换计划重新做”，完全不需要预定义固定的流程。我们可以用一个简单的例子来对比：假设用户的问题是“我想在上海静安区找一家人均150以下的素食餐厅，离静安寺地铁口步行不超过10分钟，评分4.5分以上，有包厢”：增强Chain：你需要预定义一个“先搜索POI（条件：静安区、素食、人均150以下、离静安寺地铁口步行不超过10分钟、评分4.5分以上）→ 再检查搜索结果中有没有包厢的信息 → 如果有就直接输出答案，如果没有就直接告诉用户‘找不到符合条件的餐厅’”的固定流程；AI Agent：你不需要预定义固定的流程，只需要给它提供相应的Tools（POI搜索工具、大众点评详情查询工具——用于查询包厢信息），它会自主决定：先用POI搜索工具搜索“静安区、素食、人均150以下、离静安寺地铁口步行不超过10分钟、评分4.5分以上”的餐厅；然后观察搜索结果，假设搜索到了5家餐厅；再自主决定用大众点评详情查询工具查询这5家餐厅的包厢信息；假设查询到只有2家餐厅有包厢；最后自主决定把这2家餐厅的信息整理成答案输出给用户；如果搜索结果中没有符合条件的餐厅，它还会自主决定“放宽条件，比如把人均消费提高到180以下，或者把步行距离延长到15分钟，再重新搜索”。1.5.2 AI Agent的边界虽然AI Agent的能力很强，但它也不是万能的，它有以下几个明确的边界：依赖LLM的能力：AI Agent的核心是LLM，如果LLM的理解能力、推理能力、生成能力不行，AI Agent的能力也会大打折扣——比如用GPT-3.5 Turbo做旅游规划Agent，它的行程安排合理性可能不如GPT-4o mini；依赖Tools的质量：AI Agent连接外部世界的桥梁是Tools，如果Tools的API接口不稳定、数据不准确、覆盖范围不够广，AI Agent的能力也会受到很大的影响——比如用一个覆盖范围只有国内一线城市的POI搜索工具，用户想规划西藏的行程，它就根本无法处理；依赖Memory的设计：AI Agent的记忆能力是有限的，它的Context Window大小决定了它能存储多少过去的交互信息——比如用GPT-3.5 Turbo（Context Window大小是16K Token）做旅游规划Agent，如果用户的对话历史太长，超过了16K Token，它就会“忘记”之前说过的内容；无法处理完全未知的问题：如果用户的问题完全超出了LLM的知识范围和Tools的覆盖范围，AI Agent也会无能为力——比如用户想规划“2050年去火星的旅游行程”，目前没有任何Tools能提供火星的实时数据，LLM的知识范围也只有2024年之前的信息，它就根本无法处理。1.5.3 AI Agent的外延除了旅游规划领域，AI Agent还可以应用于很多其他领域，比如：客服领域：具备自主解决客户问题能力的智能客服Agent——比如可以自主查询订单信息、自主处理退款/换货申请、自主推荐产品等；金融领域：具备自主分析股票/基金/理财产品能力的智能理财顾问Agent——比如可以自主查询实时行情数据、自主分析历史数据、自主制定投资策略、自主提醒风险等；医疗领域：具备自主问诊能力的智能医疗助手Agent——比如可以自主询问用户的症状、自主查询医学知识库、自主推荐初步的治疗方案、自主提醒用户去医院就诊等；教育领域：具备自主授课、自主批改作业、自主答疑能力的智能家教Agent——比如可以自主根据用户的学习水平制定学习计划、自主讲解知识点、自主批改作业、自主回答用户的问题等；编程领域：具备自主写代码、自主调试代码、自主优化代码能力的智能编程助手Agent——比如可以自主根据用户的需求写代码、自主调试代码中的bug、自主优化代码的性能、自主解释代码的逻辑等。1.6 概念结构与核心要素组成根据Harrison Chase的四要素模型，AI Agent的概念结构与核心要素组成如下图所示（用Mermaid架构图描述）：输入复杂任务/交互信息输出最终结果/交互信息AI Agent核心组件读取交互信息/任务拆解结果/工具返回结果读取交互信息/任务目标/约束条件调用工具返回工具执行结果写入本次交互信息/最终结果调整后的计划/执行指令大语言模型 LLM大脑：理解、推理、生成记忆 Memory存储：短期记忆、长期记忆规划 Planning拆解：复杂任务拆解决策：动态多步决策反思：结果反思与调整工具 Tools连接外部世界：实时数据API知识库API、第三方服务API等用户AI Agent下面我们详细讲解每个核心要素的组成和作用：1.6.1 大语言模型（LLM）LLM是AI Agent的**“大脑”，它负责理解用户的任务/交互信息、拆解复杂任务、制定/调整多步行动计划、调用Tools、观察Tools返回的结果、反思结果是否符合预期、生成最终结果/交互信息**。目前主流的LLM有：闭源LLM：OpenAI GPT系列（GPT-4o、GPT-4o mini、GPT-4 Turbo、GPT-3.5 Turbo）、Anthropic Claude系列（Claude 3.5 Sonnet、Claude 3 Opus、Claude 3 Sonnet、Claude 3 Haiku）、Google Gemini系列（Gemini 1.5 Pro、Gemini 1.5 Flash、Gemini 1.0 Pro）、百度文心一言系列、阿里通义千问系列、腾讯混元系列等；开源LLM：Meta Llama系列（Llama 3.1 8B/70B、Llama 3 8B/70B）、Mistral系列（Mistral Large 2、Mistral 7B、Mixtral 8x7B）、Zephyr系列、Qwen系列（通义千问开源版）、GLM系列（文心一言开源版）等。对于旅游规划Agent的原型开发和小范围测试，我们推荐使用OpenAI GPT-4o mini，原因如下：理解能力强：可以理解用户的细粒度个性化需求（比如“不要商业化的平江路主街，要逛巷子里的小店”）；推理能力强：可以根据实时天气、实时景区人流量、实时交通导航时间等动态因素，制定/调整合理的行程计划；生成能力强：可以生成格式清晰、内容详细、符合用户需求的行程表；推理速度快：响应时间通常在1-3秒之间，用户体验好；价格便宜：0.15美元/百万输入Token，0.6美元/百万输出Token，搭建原型和测试大概只需要1-2美元；API接口稳定：OpenAI的API接口非常稳定，几乎不会出现宕机的情况；LangChain支持完善：LangChain对OpenAI的API接口支持非常完善，有很多现成的组件可以直接使用。1.6.2 记忆（Memory）Memory是AI Agent的**“存储设备”，它负责存储过去的交互信息（比如用户之前说过的预算、偏好、过敏史、历史行程等）、LLM的推理过程、Tools的执行结果等**，以便下次交互使用。很多开发者刚开始做AI应用时，会忽略Memory的重要性——比如用户第一次说“我是素食主义者”，第二次说“我想在上海静安区找一家餐厅”，如果没有Memory，LLM就会“忘记”用户是素食主义者，推荐的餐厅可能会有肉类菜品，用户体验会非常差。根据存储时间的长短，Memory可以分为短期记忆（Short-term Memory）和长期记忆（Long-term Memory）：短期记忆（Short-term Memory）：也叫“Context Memory”，存储的是本次会话的交互信息，通常直接存储在LLM的Context Window中——比如用户本次会话的所有问题、LLM的所有回答、Tools的所有执行结果等；长期记忆（Long-term Memory）：存储的是跨会话的交互信息，通常存储在外部数据库（比如SQLite、PostgreSQL、MongoDB）或向量数据库（比如ChromaDB、Pinecone、Weaviate）中——比如用户的基本信息（姓名、年龄、性别、职业）、长期偏好（喜欢历史人文还是自然风景、喜欢摄影还是美食、过敏史、忌口等）、历史行程、历史评价等。对于旅游规划Agent的原型开发和小范围测试，我们可以用以下方式实现Memory：短期记忆（Short-term Memory）：用LangChain现成的ConversationBufferMemory或ConversationSummaryMemory组件——ConversationBufferMemory是直接存储本次会话的所有交互信息，适合Context Window比较大的LLM（比如GPT-4o mini，Context Window大小是128K Token）；ConversationSummaryMemory是用LLM对本次会话的交互信息进行摘要，然后存储摘要，适合Context Window比较小的LLM（比如GPT-3.5 Turbo，Context Window大小是16K Token）；长期记忆（Long-term Memory）：用SQLite存储用户的基本信息、长期偏好、历史行程等结构化数据，用ChromaDB（轻量级、开源、无需单独安装的向量数据库）存储用户的历史评价、历史对话摘要等非结构化数据——ChromaDB可以把非结构化数据转换成Embedding向量，然后根据相似度检索相关的信息，比如用户之前说过“我非常喜欢苏州博物馆西馆的建筑设计”，下次用户想规划苏州的行程，ChromaDB就可以检索到这条信息，然后LLM就可以优先推荐苏州博物馆西馆。1.6.3 规划（Planning）Planning是AI Agent的**“决策中心”，它负责拆解复杂任务、制定/调整多步行动计划、反思结果是否符合预期**。根据任务的复杂程度，Planning可以分为以下几种类型：单步规划（Single-step Planning）：也叫“直接行动”，适合处理简单的、不需要拆解的任务——比如用户的问题是“今天上海的天气怎么样？”，AI Agent可以直接调用天气查询工具，然后输出结果；多步规划（Multi-step Planning）：也叫“顺序行动”，适合处理中等复杂度的、可以拆解成固定顺序的任务——比如用户的问题是“我想在上海静安区找一家人均150以下的素食餐厅，离静安寺地铁口步行不超过10分钟，评分4.5分以上，有包厢”，AI Agent可以拆解成“先搜索POI → 再查询餐厅详情 → 最后整理输出”的固定顺序；动态多步规划（Dynamic Multi-step Planning）：也叫“自主行动”，适合处理高复杂度的、需要根据结果动态调整顺序的任务——比如用户的问题是“我想在上海玩3天，第一天下午2点到虹桥火车站，最后一天晚上8点走，预算人均2000，第一天下午下雨，第二天晴天，第三天阴天，喜欢逛博物馆和老城区巷子里的小店，不要商业化的景点，帮我规划一个合理的行程”，AI Agent需要自主决定“先做什么，再做什么，第三步做什么，第四步要不要换计划重新做”。目前主流的Planning方法有：ReAct（Reasoning + Acting）：这是目前最主流、最被广泛使用的Planning方法，它的核心思想是“先推理，再行动，再观察，再推理，再行动，再观察……”，直到结果符合预期——ReAct的Prompt模板通常包含“Thought（推理）、Action（行动）、Action Input（行动输入）、Observation（观察结果）”这几个部分；Plan-and-Execute：这是一种适合处理更复杂任务的Planning方法，它的核心思想是“先制定一个完整的多步行动计划，再按照计划一步一步执行，执行过程中如果遇到问题就调整计划”；Tree-of-Thoughts（ToT）：这是一种适合处理需要探索多个可能性的任务的Planning方法，它的核心思想是“把复杂任务拆解成一棵‘思维树’，然后探索树的每个分支，评估每个分支的可行性，最后选择最优的分支”。对于旅游规划Agent的原型开发和小范围测试，我们推荐使用ReAct方法，原因如下：简单易用：LangChain有现成的ReActAgent组件可以直接使用；可解释性强：ReAct的Prompt模板包含“Thought、Action、Action Input、Observation”这几个部分，我们可以清楚地看到AI Agent的推理过程和行动过程，方便调试和优化；适合处理旅游规划这类需要动态调整的任务：ReAct可以根据Tools返回的结果，动态调整推理过程和行动过程，比如搜索到的景点临时闭园，它就可以调整计划，换备选景点。下面我们用一个简单的例子来演示ReAct的工作流程：假设用户的问题是“今天上海的天气怎么样？如果下雨的话，帮我找一家离静安寺地铁口步行不超过10分钟的书店”：Thought（推理）：用户的问题有两个部分，第一个部分是“今天上海的天气怎么样”，第二个部分是“如果下雨的话，帮我找一家离静安寺地铁口步行不超过10分钟的书店”。我需要先调用天气查询工具，查询今天上海的天气，然后根据天气结果决定是否需要调用POI搜索工具。Action（行动）：我需要调用的工具是WeatherQueryTool。Action Input（行动输入）：城市名称是“上海”。Observation（观察结果）：今天上海的天气是“小雨，气温22-26℃，东北风3-4级”。Thought（推理）：今天上海的天气是小雨，符合用户的第二个条件，我需要调用POI搜索工具，搜索离静安寺地铁口步行不超过10分钟的书店。Action（行动）：我需要调用的工具是POISearchTool。Action Input（行动输入）：城市名称是“上海”，关键词是“书店”，位置是“静安寺地铁口”，半径是“800米”（因为步行10分钟大概是800米）。Observation（观察结果）：搜索到了5家符合条件的书店，分别是“钟书阁（芮欧百货店）”、“言几又·今日阅读（静安嘉里中心店）”、“西西弗书店（静安大悦城店）”、“大众书局（南京西路店）”、“衡山·和集（华山路店）”。Thought（推理）：我已经搜索到了符合条件的书店，现在需要把天气结果和书店信息整理成答案输出给用户。Final Answer（最终答案）：今天上海的天气是小雨，气温22-26℃，东北风3-4级。为您推荐以下5家离静安寺地铁口步行不超过10分钟的书店：1. 钟书阁（芮欧百货店）；2. 言几又·今日阅读（静安嘉里中心店）；3. 西西弗书店（静安大悦城店）；4. 大众书局（南京西路店）；5. 衡山·和集（华山路店）。下面我们用Mermaid流程图来描述ReAct的工作流程：是否是否是否