Java压缩文件核心是ZipOutputStream配合FileInputStream流式处理,需正确构建ZipEntry、处理路径与中文名、递归压缩目录,并用try-with-resources确保资源安全关闭。

Java中压缩文件主要依靠java.util.zip包提供的流式API,核心是ZipOutputStream配合FileInputStream逐文件写入,而非一次性加载整个文件到内存。关键在于正确构建ZipEntry、处理路径、关闭资源,并注意中文文件名兼容性。
ZipOutputStream + FileInputStream 基础流程
这是最常用、最可控的压缩方式:以输出流为驱动,为每个待压缩文件创建一个ZipEntry,再把该文件内容通过输入流读取并写入ZIP流。
- 先创建
FileOutputStream指向目标ZIP文件,再包装成ZipOutputStream - 遍历待压缩文件列表,对每个
File新建ZipEntry,注意设置名称(推荐用File.toPath().relativize()或手动清理路径) - 调用
putNextEntry()开启当前条目,再用Files.copy(file.toPath(), zipOut)或传统字节数组循环读写 - 每个条目写完必须调用
closeEntry(),否则ZIP结构损坏;全部完成再close()输出流
处理中文文件名与跨平台兼容性
默认ZipOutputStream使用ISO-8859-1编码,直接写入中文名会导致乱码或解压失败。JDK7+可通过反射设置UTF-8,但更稳妥的方式是使用Apache Commons Compress或TrueZip等第三方库;若坚持原生API,可启用sun.nio.cs.StandardCharsets.UTF_8(非标准,不推荐),或改用java.util.zip.ZipFile读取时指定编码(仅限读)。
- JDK9+支持
ZipOutputStream(OutputStream, Charset)构造方法,传入StandardCharsets.UTF_8即可 - 旧版本建议统一转义为英文命名,或引入
commons-compress,用ZipArchiveOutputStream并调用setUseUnicodeExtraFields(true) - 避免在路径中使用
..或绝对路径,防止ZIP遍历漏洞(如../../../etc/passwd)
递归压缩目录的实用技巧
压缩整个文件夹时,需深度优先遍历所有子文件和子目录,并为每个File生成对应ZIP路径。目录本身也要添加ZipEntry(名称以/结尾,且不写入内容)。
立即学习“Java免费学习笔记(深入)”;
- 用
Files.walk()或递归file.listFiles()获取所有条目 - 计算ZIP内路径:用源根路径截取相对路径,替换
File.separator为/(ZIP规范要求正斜杠) - 遇到目录时,创建
ZipEntry并调用setDirectory(true),再putNextEntry后立即closeEntry - 大文件建议设置缓冲区(如8192字节),避免频繁IO;小文件可批量写入提升效率
异常处理与资源安全关闭
ZIP流嵌套多层,容易因异常导致流未关闭,产生损坏ZIP或文件句柄泄漏。务必使用try-with-resources,或确保finally中关闭ZipOutputStream和底层FileOutputStream。
-
ZipOutputStream关闭会自动调用底层流的close(),但显式声明资源更清晰 - 捕获
ZipException(如重复条目、不支持压缩方式)、IOException(磁盘满、权限不足) - 压缩过程中若某文件读取失败,可选择跳过并记录警告,而非中断整个压缩任务










