Java文本查找工具应优先使用标准API:indexOf/contains实现快速子串匹配,Pattern/Matcher处理复杂模式,结合toLowerCase或(?i)支持忽略大小写,预处理空格提升鲁棒性,并封装为可配置的工具类以增强复用性。

Java中实现文本查找工具,核心在于灵活运用字符串内置方法与正则表达式,兼顾性能、可读性和扩展性。不必依赖外部库,标准API已足够支撑常见需求。
基础字符串匹配:indexOf与contains
适用于简单子串查找,速度快、语义清晰。
- contains():返回boolean,判断是否包含目标子串,适合条件判断
- indexOf(String str):返回首次出现的索引(-1表示未找到),支持从指定位置开始搜索(indexOf(str, fromIndex))
- 多次查找可用循环配合indexOf更新起始位置,例如查找所有匹配位置
精准定位与批量提取:正则表达式(Pattern/Matcher)
当查找逻辑涉及模式(如邮箱、手机号、带空格的单词、大小写不敏感等),正则表达式是首选。
- 用Pattern.compile("regex")预编译正则,提升重复使用时的性能
- Matcher.find()逐个匹配,Matcher.group()获取匹配内容,Matcher.start()/end()获取位置信息
- 注意转义字符(如\\d匹配数字)、标志位(Pattern.CASE_INSENSITIVE忽略大小写)
忽略大小写与空白差异的查找
真实文本常存在格式不规范问题,需做预处理或选用合适策略。
立即学习“Java免费学习笔记(深入)”;
- 统一转为小写后用contains或indexOf,适合简单场景(text.toLowerCase().contains(keyword.toLowerCase()))
- 正则中加(?i)前缀实现不区分大小写,如"(?i)java"
- 若需跳过多余空白(如"hello world"匹配"hello world"),可用replaceAll("\\s+", " ")标准化空格后再查
封装成可复用的查找工具类
把常用操作抽象为方法,提升代码复用性与可维护性。
- 提供findAll(String text, String keyword)返回所有索引列表
- 提供findAllRegex(String text, String regex)返回匹配字符串列表或MatchResult集合
- 增加参数如ignoreCase、trimWhitespace控制行为,内部按需组合处理逻辑










