Python教学:控制台乱码及Unicode与Utf-8的区别等-由Deepseek产生

张

张建站

2026/6/6 9:07:35

10分钟阅读

Python教学:控制台乱码及Unicode与Utf-8的区别等-由Deepseek产生

在 Python 中输出中文时出现乱码主要是因为控制台终端的字符编码与 Python 输出的字符串编码不一致。不同控制台默认编码可能不同例如 Windows 的 cmd 默认是 GBK而 macOS/Linux 的终端默认是 UTF-8因此同样的代码在不同环境下的表现会不同。要避免乱码可以从以下几个方面解决1. 统一使用 UTF-8 编码源代码文件保存为 UTF-8 格式并在文件头部添加编码声明Python 3 默认 UTF-8可省略Python 2 必须添加# -*- coding: utf-8 -*-字符串使用 UnicodePython 3 中print(中文)默认为 Unicode直接使用即可。Python 2 中需使用u中文前缀。2. 设置标准输出的编码通过环境变量PYTHONIOENCODING强制 Python 使用 UTF-8 输出Windows (cmd)set PYTHONIOENCODINGutf-8 python your_script.pyLinux/macOSexportPYTHONIOENCODINGutf-8 python your_script.py或者在代码中动态设置importsysimportio sys.stdoutio.TextIOWrapper(sys.stdout.buffer,encodingutf-8)3. 调整控制台自身的编码Windows cmd切换到 UTF-8 代码页65001并选择支持中文的字体如“新宋体”或“Lucida Console”chcp 65001 python your_script.pyWindows PowerShell / 新版 Windows Terminal默认支持 UTF-8通常无需额外设置。Linux/macOS 终端默认 UTF-8一般没有问题。4. 通用解决方法适配任意控制台动态获取控制台实际编码并将输出字符串转换为该编码importsysdefsafe_print(s):try:print(s)exceptUnicodeEncodeError:encodingsys.stdout.encodingorutf-8print(s.encode(encoding,errorsreplace).decode(encoding))safe_print(中文)但更推荐使用PYTHONIOENCODING或显式设置sys.stdout。5. 针对 Windows 的专用方案安装win-unicode-console库已较少使用因为新版 Python 3.7 对 UTF-8 支持改善pipinstallwin-unicode-console然后用py -m run your_script.py运行。使用 Python 3.7 内置的 UTF-8 模式需要 Windows 10 1903设置系统区域中的“Beta 版使用 Unicode UTF-8 提供全球语言支持”或运行python -X utf8 your_script.py总结最佳实践Python 3 终端支持 UTF-8直接写print(中文)无需额外处理。跨环境运行在脚本开头设置sys.stdout编码为 UTF-8并确保终端支持 UTF-8如使用 Windows Terminal 或 VS Code 终端。简单临时方案运行前执行set PYTHONIOENCODINGutf-8Windows或export PYTHONIOENCODINGutf-8Linux/macOS。⚠️ 注意如果控制台本身不支持 Unicode如老旧 Windows cmd 使用 raster 字体即使代码正确也会显示方框或问号。此时需要更换终端或调整字体。Unicode和UTF-8是两个不同层面的概念常被混淆但区别非常明确Unicode一个字符集character set。它为世界上所有字符分配了一个唯一的数字编号码点Code Point例如汉字“中”的 Unicode 码点是U4E2D。它只解决“哪个数字代表哪个字符”不关心这个数字在计算机中如何存储或传输。UTF-8一种字符编码方案character encoding scheme。它定义了如何将 Unicode 码点那些数字转换为字节序列以便在内存、文件或网络中存储和传输。UTF-8 是变长编码1~4 字节兼容 ASCIIU0000 ~ U007F 用一个字节表示且与 ASCII 完全相同。核心区别总结特性UnicodeUTF-8本质字符到数字的映射表数字到字节的转换规则是否定长码点是定长21位有效但抽象概念变长编码1~4 字节举例“A” → U0041“中” → U4E2DU0041 →0x41(1字节)U4E2D →0xE4 0xB8 0xAD(3字节)存储/网络不能直接用于存储可以直接存储或传输更直观的理解Unicode像一本《全球字符→数字字典》A → 41中 → 4E2D → 1F60A。UTF-8像一个打包规则如何把字典里的数字装进字节包里1个字节装不下就拆成2/3/4个字节并且拆开后还能准确还原。为什么需要两者分开如果只用 Unicode 码点每个字符都需要固定 3~4 字节存储比如 UCS-4 / UTF-32英文文本会浪费大量空间。不同的编码UTF-8, UTF-16, UTF-32满足不同场景需求UTF-8 节省英文空间、兼容 ASCIIUTF-16 在中日韩文本中更紧凑UTF-32 定长处理简单。常见误区❌ “Unicode 编码就是 UTF-8”✅ 正确说法Unicode 是字符集UTF-8 是其中一种实现。❌ “UTF-8 只能表示汉字”✅ UTF-8 可以表示所有 Unicode 字符包括英文、德文、emoji 等。实际场景联系回看之前的乱码问题你的 Python 字符串中文在内存中是以 Unicode 码点存在的Python 3 内部使用灵活编码。当print()输出到控制台时Python 会将 Unicode 码点按控制台期望的编码如 GBK 或 UTF-8转换成字节流发送。如果控制台的解码规则与 Python 发送的字节流编码不一致就会产生乱码。理解 Unicode 与 UTF-8 的区别有助于你准确设置编码/解码环节从根本上避免乱码。

从流程到生态：昇腾CANN社区治理体系设计与落地实践

前言当我们深入剖析昇腾CANN开源生态系统的技术架构时，community仓库作为整个协作体系的治理基石，承载着连接昇腾NPU硬件能力与全球开发者社区的桥梁作用。不仅仅是一份静态的文档集合，更是一套经过大规模工程实践验证的协作范式。在昇腾CAN…...

2026/6/6 9:06:14 阅读更多 →

RT-Thread Nano实战避坑：FinSH组件、信号量、消息队列的配置与调试血泪史

RT-Thread Nano实战避坑指南：FinSH组件、信号量与消息队列的深度调试解析从LED闪烁到复杂组件：RT-Thread Nano的进阶之路当开发者从简单的LED控制转向RT-Thread Nano的高级功能时，往往会遇到一系列意料之外的挑战。FinSH命令行组件、信号量同…...

2026/6/6 9:04:58 阅读更多 →

ESP32-S3上跑MicroPython直接读QMA6100P加速度值（带接线图、可调量程、mg单位输出）

本文还有配套的精品资源，点击获取简介：一套开箱即用的ESP32-S3 MicroPython QMA6100P加速度计实测方案。main.py文件已内置完整I2C驱动逻辑：自动初始化GPIO引脚（默认SCLGPIO8，SDAGPIO9），配…...

2026/6/6 9:03:58 阅读更多 →

Windows防撤回终极指南：如何永久保存微信QQ撤回消息

Windows防撤回终极指南：如何永久保存微信QQ撤回消息【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/…...

2026/6/5 8:41:58 阅读更多 →

终极视频下载解决方案：VideoDownloadHelper 完全指南

终极视频下载解决方案：VideoDownloadHelper 完全指南【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网络上的精彩…...

2026/6/4 10:13:41 阅读更多 →

小微企业合作网络与成长预测解析方案【附代码】

✨ 长期致力于小微企业、合作网络、网络结构、企业成长、成长预测研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于提名生成法的合作网络构建与结构…...

2026/6/5 8:42:00 阅读更多 →

终极键盘映射工具：如何免费解决游戏按键冲突问题

终极键盘映射工具：如何免费解决游戏按键冲突问题【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏中因为同时按下左右方向键而让角色卡顿不前？是否在关键时刻因为按键…...

2026/6/5 8:41:59 阅读更多 →