编译器对字符串拼接做字节码优化:纯字面量如"a"+"b"+"c"直接合并为常量,含变量则运行时用StringBuilder;substring从Java 7u6起不再共享数组以避免内存泄漏;strip比trim支持更广Unicode空白但性能低2–3倍。

用 + 连接字符串时,编译器到底做了什么
Java 中写 "a" + "b" + "c" 看似简单,但编译器会在字节码层面优化成常量拼接;而一旦涉及变量(比如 String s = "x"; s + "y"),就会在运行时生成 StringBuilder 实例来 append。这意味着:纯字面量拼接无性能负担,但循环内用 + 拼接大量字符串会频繁创建临时对象。
- 循环中拼接 1000 条日志?改用
StringBuilder.append() - 方法参数是多个字符串字面量?放心用
+,Javac 已帮你优化 - 有
null参与拼接?+会自动转成字符串"null",不是 NPE —— 但可能不是你想要的结果
String.concat() 和 String.join() 的适用边界
concat() 只接受单个字符串参数,本质是新建 char 数组并复制内容,适合“一个字符串加另一个”的轻量场景;join() 则专为多段拼接设计,支持分隔符,底层也用 StringBuilder,更安全高效。
-
"hello".concat(" world")等价于"hello" + " world",但不可链式调用多个 - 拼接数组:
String.join("-", list)比手写 for ++更简洁、空值处理更可控 -
join()对null元素默认抛NullPointerException,需提前过滤或用Collections.nCopies()等兜底
为什么 String.substring() 在 Java 7u6 之后不再共享底层数组
旧版 JDK 中,substring() 只新建 String 对象,但复用原字符串的 char[],导致小子串长期持有可能巨大的原始数组(内存泄漏)。从 Java 7u6 起,该方法改为拷贝实际需要的字符段——更安全,但也意味着每次调用都有复制开销。
- 若频繁从大字符串切小片段且关注 GC 压力,可考虑用
CharBuffer.wrap().subSequence()避免复制(但注意它不兼容 String API) - 不要依赖
substring()的实现细节做性能假设;JDK 9+ 改用 byte[] 存储,编码影响进一步加大 - 切片前检查索引:越界直接抛
StringIndexOutOfBoundsException,不静默截断
用 String.strip() 替代 trim() 的真实代价
trim() 只删 ASCII 空格(U+0000–U+0020),而 strip()(Java 11+)按 Unicode 标准识别所有空白字符(如 、\u2000–\u200F、\u3000)。但代价是:每次调用都触发 Character.isWhitespace() 查表,比 trim() 多约 2–3 倍 CPU 时间。
立即学习“Java免费学习笔记(深入)”;
- 处理用户输入含全角空格或换行符?必须用
strip()或stripLeading()/stripTrailing() - 只处理英文日志文件?
trim()仍更快,且语义明确 - 注意:
strip()不处理\r\n以外的行终止符(如\u2028),若需完全标准化换行,请配合System.lineSeparator()后处理
String text = " \u3000 hello\u2002world \n "; System.out.println(text.trim()); // "hello\u2002world \n "(\u3000 和 \u2002 未被删) System.out.println(text.strip()); // "hello\u2002world"(两端所有 Unicode 空白均被删)字符串操作看似基础,但每个方法背后都有版本演进、内存模型和 Unicode 规范的咬合点。别只看文档描述,得看字节码、测 GC、查源码。










