手把手搭建 AI 模型中转服务：用 New API 部署你自己的统一 AI 网关

张

张建站

2026/5/6 13:44:51

10分钟阅读

手把手搭建 AI 模型中转服务用 New API 部署你自己的统一 AI 网关末尾带一键部署脚本导读用 DeepSeek、GLM、Qwen 等模型每个都要单独申请 API Key、记不同的接口地址切换起来麻烦。要是有一个「统一入口」一个 Key 访问所有模型还能管理额度、自动负载均衡是不是很爽今天教你用开源项目 New API搭建一个属于自己的 AI 模型中转服务。什么是 AI 模型中转服务打个比方你的手机里有微信、支付宝、银行卡每张卡单独充值、单独记账管理起来很麻烦。现在你办了一张「超级卡」把所有卡绑定到一起出门只刷这一张——AI 模型中转服务就是这个「超级卡」。技术说法一个统一的 API 网关把 DeepSeek、GLM、Qwen、Claude 等不同厂家的模型接口全部转成统一的 OpenAI API 格式。你只需要一个地址、一个 Key就能访问所有模型。今天推荐的主角New API是经典项目 One API 的增强升级版界面全新、功能更丰富。为什么要自建中转市面上有第三方中转服务比如 API2D、OhMyGPT 等为什么还要自己搭对比项第三方中转自建中转成本加价 20%-50%只付模型厂商原价数据安全请求经过第三方服务器数据只在你自己的服务器稳定性取决于第三方运营自己掌控模型支持有限想加多少加多少额度管理不灵活精确控制还能分给团队一句话总结自建中转更省钱更安全更自由。准备工作搭建前你需要准备1. 一台服务器或本地电脑云服务器阿里云、腾讯云轻量级服务器即可2 核 2G 够用一个月几十块本地电脑Mac、Windows、Linux 都行直接在本机跑需要安装 Docker后面会教你2. 至少一个模型的 API Key先申请一个你常用的模型 Key模型申请地址免费额度DeepSeekplatform.deepseek.com注册送额度GLM智谱open.bigmodel.cnglm-4-flash 免费Qwen通义dashscope.console.aliyun.comqwen-turbo 免费3.可选Trae如果你用 Trae 写代码可以全程在 Trae 里操作——用 Trae 的终端执行 Docker 命令边搭边测试。为什么选 New API目前主流的开源中转项目有两个项目GitHub 地址特点One APIgithub.com/songquanpeng/one-api老牌经典20k Star稳定可靠New APIgithub.com/QuantumNous/new-apiOne API 增强版全新 UI功能更强New API 比 One API 多了什么功能One APINew API界面传统风格全新现代 UI在线充值❌✅ 支持多种支付缓存计费❌✅ 相同请求不重复扣费模型限流❌✅ 精确控制每个模型速率Midjourney❌✅ 支持数据看板基础更详细的使用统计一句话New API 是 One API 的全面升级版界面好看、功能更多而且完全兼容 One API 的配置迁移零成本。今天以New API为例讲解。第一步安装 DockerDocker 是什么一个「容器工具」帮你一键运行各种服务不用操心环境配置。Mac 用户下载 Docker DesktopM 芯片选 Apple Silicon 版本安装后打开等状态栏小鲸鱼图标稳定即可验证安装打开终端输入docker --version # 显示类似 Docker version 27.x.x 就对了Windows 用户下载 Docker Desktop安装时勾选 WSL 2Windows Subsystem for Linux重启后验证docker --versionLinux 用户Ubuntu/Debian# 一键安装 curl -fsSL https://get.docker.com | sh # 启动并设置开机自启 sudo systemctl start docker sudo systemctl enable docker # 验证 docker --version 如果你在 Trae 里操作直接在 Trae 的终端面板执行这些命令就行。第二步一键部署 New API一条 Docker 命令搞定复制粘贴就行# 使用 SQLite个人使用足够 docker run --name new-api -d \ --restart always \ -p 3000:3000 \ -e TZAsia/Shanghai \ -v ~/new-api-data:/data \ calciumion/new-api如果你有 MySQL推荐生产环境使用加上数据库参数docker run --name new-api -d \ --restart always \ -p 3000:3000 \ -e SQL_DSNroot:你的密码tcp(localhost:3306)/newapi \ -e TZAsia/Shanghai \ -v ~/new-api-data:/data \ calciumion/new-api命令解释不用背了解就行参数含义--name new-api容器名字叫 new-api-d后台运行--restart always服务器重启后自动启动-p 3000:3000把容器 3000 端口映射到本机 3000 端口-e TZAsia/Shanghai时区设为上海-v ~/new-api-data:/data数据持久化存在 ~/new-api-data 目录如果上面的镜像拉取失败国内网络问题换用 GitHub 镜像# 把 calciumion/new-api 换成 ghcr.io/calciumion/new-api:latest或者用 Docker Compose推荐创建docker-compose.yml文件services: new-api: image: calciumion/new-api:latest container_name: new-api ports: - 3000:3000 environment: - TZAsia/Shanghai volumes: - ~/new-api-data:/data restart: unless-stopped然后执行docker compose up -d等 1-2 分钟拉取完成后浏览器访问http://localhost:3000看到 New API 的登录页面就成功了第三步系统初始化第四步添加模型渠道这是最关键的一步——把你已有的模型 API Key 添加进去。以 DeepSeek 为例进入后台 → 点击左侧「渠道」→「添加新的渠道」填写字段填什么类型选择DeepSeek名称随便起比如DeepSeek-V3Base URLhttps://api.deepseek.com密钥你的 DeepSeek API Key模型选择deepseek-chat点「测试」按钮显示成功即可点「提交」保存添加 GLM智谱字段填什么类型智谱 ChatGLMBase URLhttps://open.bigmodel.cn/api/paas/v4密钥你的智谱 API Key模型glm-4-flash免费添加 Qwen通义千问字段填什么类型阿里通义千问Base URLhttps://dashscope.aliyuncs.com/compatible-mode/v1密钥你的阿里 API Key模型qwen-turbo免费 New API 支持几十种模型厂商基本主流的都有预设类型。添加过程都类似选类型 → 填 URL → 填 Key → 选模型 → 测试 → 保存。第五步创建令牌Token渠道添加好后你需要生成一个「统一令牌」给外部使用左侧菜单 →「令牌」→「添加新的令牌」设置名称比如my-token额度设置一个上限比如 100 万 Token过期时间可选永不过期允许模型可以选「全部」或限制特定模型提交后系统会生成一个sk-xxx格式的令牌这个令牌就是你以后唯一的 API Key第六步在 Trae 中使用你的中转服务回到 Trae添加自定义模型参数填什么API URLhttp://你的服务器IP:3000API Key第五步生成的令牌sk-xxx模型名deepseek-chat或glm-4-flash等现在你在 Trae 里请求模型时流量走的是你自己的中转服务再由中转服务分发到对应的模型厂商。本地部署的话URL 就是http://localhost:3000云服务器部署的话建议加个域名和 HTTPS后面会说。快速上手New API 常用功能一览部署好之后New API 后台功能很多这里挑几个最常用的快速过一遍更多玩法自己探索。1. 查看用量统计后台首页就是数据看板能看到- 今日消耗 Token 数- 各模型调用量排行- 每小时请求趋势图养成看一眼的习惯能发现异常消耗比如某个 Key 被盗用。2. 给团队成员分配额度如果你是团队使用可以给每个成员创建独立令牌「令牌」→「添加新令牌」→ 设置名称和额度上限比如给同事 A 分配 50 万 Token用完为止每个令牌可以限制只允许访问特定模型这样不用担心某人把团队额度用完。3. 设置模型优先级如果同一个模型如deepseek-chat添加了多个渠道可以在渠道设置里调整优先级优先级高的先跑失败了自动切到下一个可以设置不同渠道的权重实现按比例分流比如 DeepSeek 官方渠道优先备用一个第三方渠道保证服务不中断。4. 在其他工具中使用除了 TraeNew API 生成的统一地址和令牌可以用在任何支持 OpenAI API 格式的工具里工具配置位置ChatBox / NextChat设置 → 自定义接口 → 填你的中转地址和 KeyCursorSettings → Models → OpenAI API Key → 填你的令牌OpenClawproviders 配置 → baseUrl 指向你的中转地址Python 代码openai.ApiBase http://你的地址:3000/v1 所有工具的配置方式都一样把官方地址换成你的中转地址Key 换成你的令牌。更多高级功能在线充值、缓存计费、模型限流、日志审计等后面会单独出一篇进阶教程。关注公众号不错过更新进阶加域名和 HTTPS如果你在云服务器上部署IP 端口访问不够优雅也不安全。建议加域名和 HTTPS。1. 绑定域名准备一个域名比如api.yourdomain.com在域名解析里添加 A 记录指向你的服务器 IP。2. 用 Nginx 反向代理server { listen 80; server_name api.yourdomain.com; location / { proxy_pass http://127.0.0.1:3000; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; } }3. 配置 HTTPS推荐 certbot# 安装 certbot sudo apt install certbot python3-certbot-nginx # 一键申请证书 sudo certbot --nginx -d api.yourdomain.com完成后你就可以用https://api.yourdomain.com/v1/chat/completions作为 API 地址了。常见问题1. Docker 拉取镜像很慢国内网络拉 Docker Hub 镜像可能很慢。解决方案使用 GitHub 镜像ghcr.io/calciumion/new-api:latest或者配置 Docker 镜像加速器搜索「Docker 国内镜像源」获取最新地址2. 渠道测试失败检查 API Key 是否正确检查 Base URL 是否包含多余路径New API 会自动拼接/v1/chat/completions所以 Base URL 只填到域名或/v4即可检查服务器是否能访问外网curl https://api.deepseek.com测试3. 模型响应很慢检查服务器到模型厂商的网络延迟可以在 New API 里添加多个同类渠道系统会自动负载均衡开启「失败自动重试」功能4. 怎么更新 New APIdocker pull calciumion/new-api:latest docker rm -f new-api # 然后重新执行 docker run 命令即可或者用 watchtower 自动更新docker run --rm -v /var/run/docker.sock:/var/run/docker.sock containrrr/watchtower -cR成本估算自建中转到底能省多少场景第三方中转自建中转节省DeepSeek 100 万 Token约 ¥15-20加价 30%-50%¥10官方原价30%-50%GLM-4-Flash第三方可能不支持免费官方免费100%Qwen-turbo第三方可能不支持免费官方免费100%多模型混用每个 Key 单独管理一个 Key 统一管理管理成本大幅降低服务器成本轻量云服务器约 ¥30-50/月如果你本机跑则完全免费。写在最后自建 AI 模型中转服务听起来高大上实际就是一条 Docker 命令的事。核心收益-省钱直接用官方价格没有中间商赚差价-省心一个 Key 管所有模型-安全数据不经过第三方-灵活想加什么模型就加什么模型一句话建议哪怕你现在只用一个模型也建议搭一个。以后加新模型就是点几下鼠标的事而且 Trae 里只配一次地址就行了。为了让大家更加方便的部署提供了一键部署脚本支持mac / win) 请关注公众号回复中转站下载获取。其效果如下。完全自动化安装。你搭建中转服务遇到了什么问题或者有更好的方案评论区交流一下。关于我国内某互联网公司高级研发工程师、研发组长致力于 AI 方面的研究和学习分享。关注我一起学习成长。《MC AI技术开发》原创内容转载请注明出处

别再死记硬背了！用这个三极管放大电路，彻底搞懂二极管温度补偿（附Multisim仿真）

三极管放大电路中的二极管温度补偿：从理论到仿真的深度实践在电子电路设计中，温度稳定性一直是工程师们需要克服的关键挑战。特别是对于三极管放大电路，温度变化会导致静态工作点漂移，进而影响放大器的性能甚至造成信号失真。传统…...

2026/5/6 13:44:51 阅读更多 →

Vue项目里docx-preview插件踩坑实录：从渲染空白到样式错乱的5个常见问题解决

Vue项目中docx-preview实战疑难解析：5个典型问题与深度解决方案在Vue项目中使用docx-preview插件预览Word文档时，开发者常会遇到各种意料之外的问题。这些问题往往不是基础教程能覆盖的，需要结合具体场景深入分析。本文将针对五个最常见的疑…...

2026/5/6 13:43:50 阅读更多 →

【限时开源】20年沉淀的Docker AI最佳实践检查清单（含17个CVE高危配置自动扫描规则）

更多请点击： https://intelliparadigm.com 第一章：【限时开源】20年沉淀的Docker AI最佳实践检查清单（含17个CVE高危配置自动扫描规则） 该检查清单源自一线AI基础设施团队在生产环境持续迭代20年的容器安全经验，覆盖模…...

2026/5/6 13:43:50 阅读更多 →

LoopViT：结合循环机制的视觉Transformer优化架构

1. 项目概述在计算机视觉领域，Transformer架构近年来展现出惊人的潜力。LoopViT是我最近开发的一种新型视觉推理架构，它通过引入循环机制改进了传统视觉Transformer的计算效率和信息流模式。这个架构特别适合处理视频分析、医学影像分割等需要时序建模的…...

2026/5/6 0:37:48 阅读更多 →

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天

实战指南：深度解锁微信网页版，让浏览器也能畅快聊天【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为微信网页版频繁提示…...

2026/5/5 15:01:06 阅读更多 →

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间

智慧树学习效率提升指南：如何用自动化工具节省80%学习时间【免费下载链接】zhihuishu 智慧树刷课插件，自动播放下一集、1.5倍速度、无声项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台繁琐的视频学习流程而烦恼吗&am…...

2026/5/6 0:37:48 阅读更多 →