Python字符串编码教程_UTF8Unicode原理解析

舞夢輝影

发布时间：2026-01-08 12:39:02

886人浏览过

来源于php中文网

原创

Python字符串编码核心是区分Unicode字符串（str）与字节序列（bytes），UTF-8仅为一种编码规则；Unicode为字符分配唯一码点，UTF-8按规则将其转为1–4字节，encode/decode需匹配编码格式，文件操作须显式指定encoding。

python字符串编码教程_utf8unicode原理解析

Python中字符串编码问题的核心在于区分Unicode字符串和字节序列（bytes），UTF-8只是其中一种将Unicode字符映射为字节的规则。理解这一点，就抓住了乱码、解码错误、文件读写异常等问题的根源。

Unicode是字符的“身份证”，不是存储格式

Unicode为世界上每种语言的每个字符分配一个唯一的编号（称为码点，如汉字“中”的码点是U+4E2D）。它不规定这个编号怎么存成文件或网络传输的字节——那是编码方案（如UTF-8、UTF-16）的事。

Python 3中，str类型默认就是Unicode字符串，你写的 "你好" 在内存里是以Unicode码点形式存在的，不是UTF-8字节。

执行 type("你好") → （Unicode文本）
执行 type("你好".encode("utf-8")) → （UTF-8字节流）

UTF-8是可变长的字节编码规则

UTF-8用1–4个字节表示一个Unicode码点，原则是：ASCII字符（U+0000–U+007F）用1个字节原样保存；其余字符按规则扩展。这使得UTF-8兼容ASCII，也节省空间。

立即学习“Python免费学习笔记（深入）”；

例如：

Mangaize

一键将照片转换为动漫风格的AI工具

下载

'A' → 码点 U+0041 → UTF-8字节 b'A'（0x41）
'中' → 码点 U+4E2D → UTF-8字节 b'\xe4\xb8\xad'（3字节）
'€' → 码点 U+20AC → UTF-8字节 b'\xe2\x82\xac'（3字节）

编码（encode）和解码（decode）不能颠倒

从str转bytes叫编码（指定目标编码格式），从bytes转str叫解码（必须用当初编码时相同的格式，否则报错或乱码）。

"café".encode("utf-8") → b'caf\xc3\xa9'
b'caf\xc3\xa9'.decode("utf-8") → 'café' ✅
b'caf\xc3\xa9'.decode("gbk") → UnicodeDecodeError ❌ 或乱码

常见错误场景：读取UTF-8保存的中文文件却用open(..., encoding="gbk")，或把网络收到的UTF-8响应字节直接当str用而忘记.decode("utf-8")。

文件操作和终端显示要显式指定编码

Python不会自动猜编码。打开文件时务必用encoding参数；终端输出依赖系统环境，但代码中应确保传给print()的是str（Unicode），而非未解码的bytes。

正确读UTF-8文件：with open("data.txt", encoding="utf-8") as f: text = f.read()
正确写UTF-8文件：with open("out.txt", "w", encoding="utf-8") as f: f.write("中文")
若用open(..., "rb")读取，则得到bytes，需手动.decode("utf-8")才能变成str

Windows命令行默认GBK，可能无法正常显示UTF-8输出，可在脚本开头加：import sys; sys.stdout.reconfigure(encoding="utf-8")（Python 3.7+）。

python怎么读取xml

Python项目单元测试全流程指南_pytest实践与技巧

Python fun()函数_定义与执行fun()函数的完整流程

Python音频处理教程_Pydub音频剪辑实践

Python中functools中wraps_Python装饰器中functools.wraps的作用

相关标签:

python windows 编码字节 win Python print 字符串 class ASCII windows

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何对字典按键排序，并对每个键对应的值列表按首元素升序排列下一篇：PythonHTTP重试机制教程_请求可靠性保障

作者最新文章

mac怎么连接windows电脑

2026-01-07 20:50

mac如何安装python包

2026-01-08 02:05

电脑网卡怎么查看

2026-01-08 04:33

PythonOpenCV进阶教程_目标检测与特征匹配实战

2026-01-08 08:38

小米手机为什么不建议入手_小米手机常见问题缺点不建议买分析

2026-01-08 08:47

ao3正版app下载官方指南_AO3无官方app网页版镜像入口

2026-01-08 09:40

拼多多商家版怎么关闭通知_拼多多商家版关闭消息通知声音步骤

2026-01-08 10:09

百度网盘超级会员开通入口_百度网盘svip会员特权开通指南

2026-01-08 10:27

春运几号开始买票春运提前多久卖票

2026-01-08 10:51

夸克压缩图片免费官网_夸克压缩图片200k官方入口

2026-01-08 11:14

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

737

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

633

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

755

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11

Golang 分布式缓存与高可用架构

本专题系统讲解 Golang 在分布式缓存与高可用系统中的应用，涵盖缓存设计原理、Redis/Etcd集成、数据一致性与过期策略、分布式锁、缓存穿透/雪崩/击穿解决方案，以及高可用架构设计。通过实战案例，帮助开发者掌握如何使用 Go 构建稳定、高性能的分布式缓存系统，提升大型系统的响应速度与可靠性。

2026.01.09

热门下载

网站特效

网站源码

网站素材

前端模板