Python 的 urljoin：告别手动拼接 URL 的烦恼

张

张建站

2026/4/26 19:41:55

10分钟阅读

前言在日常爬虫、API 调用或 Web 开发中我们经常需要拼接 URL。比如基础地址是https://example.com/api/后面要加上user/info最终得到https://example.com/api/user/info。很多新手会直接用或f-string来拼接但这样很容易少写或多写斜杠导致 URL 错误。Python 标准库urllib.parse提供了一个非常方便的函数 ——urljoin它能智能地拼接 URL帮你自动处理斜杠问题。作用一句话概括urljoin(base, url)将基础地址base和相对路径url拼接成一个完整、合法的绝对 URL。基本用法from urllib.parse import urljoin base https://www.example.com relative login/ full_url urljoin(base, relative) print(full_url)输出https://www.example.com/login/瞧它自动在com和login之间加上了/完美几个简单的例子✅ 例子 1基础地址末尾有斜杠base https://example.com/ relative api/user print(urljoin(base, relative)) # https://example.com/api/user✅ 例子 2基础地址末尾没有斜杠base https://example.com relative api/user print(urljoin(base, relative)) # https://example.com/api/user注意和例子 1 结果一样urljoin会自动补充斜杠不用担心✅ 例子 3相对路径以斜杠开头base https://example.com/abc/ relative /login/ print(urljoin(base, relative)) # https://example.com/login/如果relative以/开头它会替换掉整个路径部分只保留协议和域名。✅ 例子 4相对路径是上一级目录base https://example.com/user/profile/ relative ../settings/ print(urljoin(base, relative)) # https://example.com/user/settings/urljoin也支持 Unix 风格的相对路径 (..和.)。✅ 例子 5相对路径是一个完整的 URLbase https://example.com relative https://google.com/search print(urljoin(base, relative)) # https://google.com/search如果relative已经是一个完整的绝对 URLurljoin会直接返回它忽略base。✅ 例子 6仅追加pathbase https://example.com/abc/ relative login print(urljoin(base,relative)) # https://example.com/abc/login可以封装成函数使用from urllib.parse import urljoin def urljoin_test(base, relative): # rstrip(/)去掉 base_url 末尾的斜杠防止后面手动加 / 时出现双斜杠。 base base.rstrip(/) # base_url /保证基础部分以 / 结尾。 # path.lstrip(/)去掉 path 开头的斜杠保证中间只有一个 /。 # 最后 urljoin 做最终的拼接安全可靠。 url urljoin(base /, relative.lstrip(/)) return url base https://example.com/abc/ relative /login print(urljoin_test(base,relative)) # https://example.com/abc/login如果把relative改成不以/开头这时就会在原有路径后面追加login/而不是替换。手动拼接有什么坑假设你想拼接https://ex.com/api和/v1/users# 错误示范 ❌ base https://ex.com/api bad_url base /v1/users # 结果https://ex.com/api/v1/users 看起来对好像没问题但换个场景就出问题base https://ex.com/api/ # 末尾多了一个斜杠 bad_url base /v1/users # 结果https://ex.com/api//v1/users 两个斜杠虽然浏览器有时能容忍双斜杠但这不是规范的 URL某些严格的服务端会报错。而urljoin永远不会出现双斜杠from urllib.parse import urljoin base https://ex.com/api/ print(urljoin(base, /v1/users)) # https://ex.com/api/v1/users ✅ 实际应用场景场景说明爬虫从 HTML 中提取href/news/123与当前页面 URL 拼接成绝对链接API 客户端基础地址https://api.example.com/v1动态拼接users,posts等端点Django/Flask 测试测试中动态构建请求 URL配置文件配置一个base_url各处调用urljoin拼接子路径代码模板直接复制用from urllib.parse import urljoin class ApiClient: def __init__(self, base_url): self.base_url base_url.rstrip(/) # 去掉末尾斜杠urljoin 会自动加 def _url(self, path): return urljoin(self.base_url /, path.lstrip(/)) def get_users(self): full_url self._url(/users) print(f请求地址: {full_url}) # 这里发请求... client ApiClient(https://myapi.com) client.get_users() # 输出: 请求地址: https://myapi.com/users⚠️ 注意事项新手常见疑问urljoin不会做网络请求它只负责字符串拼接。第二个参数以//开头时例如//example.com/会沿用原协议http 或 https但这种行为很多新手可能想不到尽量避免这样用。第二个参数以?或#开头时会替换原 URL 的查询参数或锚点。如果需要处理非常规 URL比如file:///C:/testurljoin也能工作。总结方法是否智能处理斜杠是否支持..路径推荐程度手动❌❌不推荐f-string❌❌不推荐os.path.join❌用于文件路径不是 URL❌不推荐urljoin✅✅✅ 强烈推荐一句话记住以后拼接 URL直接用urljoin别再手动加斜杠了扩展阅读官方文档urllib.parse.urljoinRFC 1808 - Relative Uniform Resource Locators

2025终极指南：如何彻底解决Tiled地图编辑器路径引用问题的3种方法

2025终极指南：如何彻底解决Tiled地图编辑器路径引用问题的3种方法【免费下载链接】tiled Flexible level editor 项目地址: https://gitcode.com/gh_mirrors/ti/tiled Tiled是一款强大的开源地图编辑器，广泛应用于游戏开发中的关卡设计和地图制作…...

2026/4/26 19:40:58 阅读更多 →

第83篇：AI项目团队组建与管理——如何招聘、考核与激励AI人才？（面试速览）

文章目录考点概览Q&A（含难度标注）Q1：与传统软件工程师相比，AI人才（特别是算法研究员/工程师）的招聘有哪些特殊性和挑战？（难度：⭐⭐⭐）Q2：如何…...

2026/4/26 19:34:42 阅读更多 →

NumPy数组广播机制详解与应用实践

1. NumPy数组广播机制入门指南在科学计算和机器学习领域，NumPy的广播机制是一个强大而优雅的特性。我第一次接触这个概念是在处理图像数据时，当时需要将一个3通道的RGB图像与一个单通道的滤波器进行运算。传统方法需要手动扩展维度，而广播机制…...

2026/4/26 19:20:50 阅读更多 →

保姆级避坑指南：用MIM搞定MMSegmentation 2.0.0安装，告别版本兼容性报错

深度学习语义分割实战：MMSegmentation 2.0极简安装与避坑手册在计算机视觉领域，语义分割技术正以惊人的速度重塑着医疗影像分析、自动驾驶和工业质检等场景的应用边界。作为OpenMMLab生态中的重要成员，MMSegmentation 2.0凭借其模块化设计和…...

2026/4/26 0:05:40 阅读更多 →

Chrome-GPT：将大语言模型深度集成到浏览器的开发实践

1. 项目概述：当浏览器插件遇上大语言模型最近在折腾一个挺有意思的开源项目，叫“Chrome-GPT”。光看名字，你大概就能猜到它的核心玩法：把当下最火的大语言模型（LLM）能力，直接集成到我们每天都要…...

2026/4/26 0:05:44 阅读更多 →

别再用Node.js写MCP网关了！C++ 2024性能基准测试：相同硬件下吞吐量超Go 3.8倍，延迟降低62%

更多请点击： https://intelliparadigm.com 第一章：MCP协议核心原理与C网关设计全景概览 MCP（Modular Communication Protocol）是一种面向微服务间低延迟、高可靠通信的二进制协议，其核心在于“模块化帧结构”与“状态…...

2026/4/26 0:05:49 阅读更多 →

终极指南：如何通过Newtonsoft.Json配置实现高性能JSON序列化

终极指南：如何通过Newtonsoft.Json配置实现高性能JSON序列化【免费下载链接】Newtonsoft.Json Json.NET is a popular high-performance JSON framework for .NET 项目地址: https://gitcode.com/gh_mirrors/ne/Newtonsoft.Json Newtonsoft.Json&#xff08…...

2026/4/26 0:07:30 阅读更多 →