Python用tarfile模块可创建tar、tar.gz、tar.bz2等归档文件;通过tarfile.open()以"w"、"w:gz"等模式打开,add()添加文件目录,addfile()写入内存内容,filter参数可过滤排除项。

Python 用 tarfile 模块可以轻松创建(生成)tar 归档文件,支持纯 tar、tar.gz、tar.bz2 等格式。核心是使用 tarfile.open() 以写入模式打开归档,再用 add() 或 addfile() 添加文件或目录。
基础:创建一个普通 tar 文件
最简单的方式是把一个本地目录或单个文件打包成 .tar:
import tarfile创建 tar 文件(不压缩)
with tarfile.open("archive.tar", "w") as tar: tar.add("my_folder/") # 添加整个文件夹
或 tar.add("file.txt") # 添加单个文件
✅ 注意:"w" 表示未压缩的 tar;路径会保留相对结构,建议用相对路径避免绝对路径问题。
立即学习“Python免费学习笔记(深入)”;
带压缩:生成 tar.gz 或 tar.bz2
只需改写入模式即可自动启用对应压缩算法:
-
"w:gz"→ 生成.tar.gz(需 zlib 支持,Python 默认内置) -
"w:bz2"→ 生成.tar.bz2(需 bz2 模块) -
"w:xz"→ 生成.tar.xz(需 lzma,Python 3.3+ 内置)
示例:
技术上面应用了三层结构,AJAX框架,URL重写等基础的开发。并用了动软的代码生成器及数据访问类,加进了一些自己用到的小功能,算是整理了一些自己的操作类。系统设计上面说不出用什么模式,大体设计是后台分两级分类,设置好一级之后,再设置二级并选择栏目类型,如内容,列表,上传文件,新窗口等。这样就可以生成无限多个二级分类,也就是网站栏目。对于扩展性来说,如果有新的需求可以直接加一个栏目类型并新加功能操作
with tarfile.open("archive.tar.gz", "w:gz") as tar:
tar.add("data/", arcname="data") # arcname 可重命名归档内路径
精细控制:添加内存中的内容(不依赖磁盘文件)
如果想把字符串或字节内容直接写入 tar(比如日志、配置片段),可构造 TarInfo 并用 addfile():
import tarfile from io import BytesIOcontent = b"Hello from memory!\n" tarinfo = tarfile.TarInfo("message.txt") tarinfo.size = len(content)
with tarfile.open("in_memory.tar", "w") as tar: tar.addfile(tarinfo, fileobj=BytesIO(content))
⚠️ 注意:必须手动设置 size,且 fileobj 必须是类文件对象(如 BytesIO),且只读取一次。
排除文件 / 过滤内容
通过 filter 参数可动态控制哪些项加入归档:
def exclude_pyc(tarinfo):
if tarinfo.name.endswith(".pyc") or "__pycache__" in tarinfo.name:
return None # 排除该项
return tarinfo
with tarfile.open("clean.tar", "w") as tar:
tar.add("src/", filter=exclude_pyc)
这个函数接收每个待添加项的 TarInfo 对象,返回 None 即跳过,返回原对象或修改后的对象则正常加入。










