
Java正则表达式高效处理连续换行符和空格
本文探讨如何利用Java正则表达式,优雅地替换文本中连续出现的换行符\n(包含中间空格的情况),并可选地去除首尾换行符。 问题在于将多个连续的换行符(可能包含空格)替换为单个换行符。例如,输入文本\naaaaaa: \n\nbbbbbbb \n \n\nccccc\n\n\n,期望输出\naaaaaa: \nbbbbbbb \nccccc\n。
之前尝试的\n+\s*\n*正则表达式未能成功的原因在于对Java字符串转义和正则表达式元字符的理解不足。 \n在Java字符串字面量中需写成\\n,而在正则表达式中,\ 又需要转义,因此在Java代码中,匹配\n的正则表达式应为\\\\n。
更有效的正则表达式是\n\s*\n,它匹配一个换行符,后跟零个或多个空格,再跟一个换行符。 无需+号,因为我们只需要匹配至少两个换行符及其间的空格,替换为单个\n即可。
立即学习“Java免费学习笔记(深入)”;
以下Java代码演示了如何实现这一替换,并额外处理了首尾换行符:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReplaceNewLine {
public static void main(String[] args) {
String input = "\nAAAAAA: \n\nBBBBBBB \n \n\nCCCCC\n\n\n";
// 正则表达式匹配连续换行符和空格
Pattern pattern = Pattern.compile("\\n\\s*\\n");
Matcher matcher = pattern.matcher(input);
String output = matcher.replaceAll("\n");
// 去除首尾换行符
output = output.trim();
System.out.println(output);
}
}
这段代码首先编译正则表达式\\n\\s*\\n,然后使用replaceAll()方法将所有匹配项替换为单个\n。 最后,trim()方法去除字符串首尾的空格和换行符,完善了结果。 这提供了一种简洁高效的解决方案。










