1. 什么是 prompt英文本意是 “提示词”, 它是用户输入的一段文字,用来引导大模型生成想要的回答或完成特定任务.prompt 的构成如下:role 角色设定system. 设定LLM的身份职责, 开发者注入, 对用户不可见.user. 用户真正自己输入的部分.assistant. 用于存储 多轮对话中模型先前的回答记录. 因为模型自身是无记忆的, 得靠 assistant 机制让模型知道 当前对话已经进行到哪一步,避免重复或断层. 示例见下个段落.LLM 调用的无状态性大语言模型(如 GPT、Llama、Qwen)每次推理都是独立的。它无法记住你上一次问了什么 —— 除非你主动把历史对话作为输入传给它.这就需要 server 工程, 将历史会话记录下来(如记录至 内存、Redis、DB). 用户第二次提问 msg2 时, Server 取出历史,构造如下的信息:[{"role":"user","content":msg1},{"role":"assistant","content":resp1},{"role":"user",