Java编译时默认编码非UTF-8,Windows下为GBK,需显式加-encoding UTF-8参数;IDE需统一设置文件编码为UTF-8并重启;运行时应设-Dfile.encoding=UTF-8且终端需支持UTF-8,三者必须一致。

Java编译时默认编码不是UTF-8,会出乱码
Java源文件若含中文,javac 编译时默认使用系统编码(Windows 是 GBK),而 IDE 或运行时环境常设为 UTF-8,导致编译后字节码中字符串字面量解码错位。典型表现是控制台输出中文为问号或方块,或 String.getBytes() 结果异常。
- Windows 上不显式指定编码,
javac Main.java实际按 GBK 读取源码 - 即使
file.encoding=UTF-8已设在 JVM 启动参数里,它只影响运行时,不影响编译阶段 - IDE(如 IntelliJ、Eclipse)通常自动加
-encoding UTF-8,但命令行或 CI 脚本容易遗漏
javac 必须显式加 -encoding UTF-8 参数
这是最直接、最可控的方式,适用于所有 Java 版本(5+)且无需修改系统配置。
javac -encoding UTF-8 Main.java
若项目含多个文件,推荐用通配符并确保路径不含空格或特殊字符:
javac -encoding UTF-8 src/*.java
-
-encoding必须放在javac命令之后、源文件名之前,顺序错误会被忽略 - 该参数只影响当前编译过程,不改变系统默认值,适合脚本化和多项目共存场景
- 不要写成
-Dfile.encoding=UTF-8—— 这是 JVM 参数,对javac无效
IDEA 和 Eclipse 的 UTF-8 设置位置不同但都需检查
IDE 自动设置可能被项目级配置覆盖,尤其从 Git 拉取的旧项目常保留 .idea/misc.xml 或 .settings/org.eclipse.core.resources.prefs 中的编码声明。
立即学习“Java免费学习笔记(深入)”;
- IntelliJ:File → Settings → Editor → File Encodings → Global Encoding / Project Encoding / Default encoding for properties files → 全部设为
UTF-8 - Eclipse:Preferences → General → Workspace → Text file encoding → 选
Other: UTF-8;再进 Preferences → Java → Compiler → Encoding → 确保勾选 “Use default encoding…” 或手动设为UTF-8 - 关键点:改完后需重启 IDE,且已有文件右下角编码标识可能仍显示旧值,需点击切换并“Reload”或“Convert”
运行时也要防编码错位:System.out 和文件 I/O
编译正确 ≠ 输出正确。终端(CMD/PowerShell/Terminal)本身编码、JVM 启动参数、以及 PrintStream 底层实现都会干扰中文显示。
- Windows CMD 默认是 CP936(GBK),即使 Java 输出 UTF-8 字节,CMD 也按 GBK 解码——此时应改终端编码:
chcp 65001,或改用支持 UTF-8 的终端(如 Windows Terminal) - JVM 启动时建议加:
java -Dfile.encoding=UTF-8 MyApp,它影响new String(byte[])、Files.readString()等 API 的默认行为 - 读写文件时别依赖默认编码:显式传参更安全,例如
Files.readString(path, StandardCharsets.UTF_8)










