
本文介绍如何用java实现:读取文件a的每一行,然后**重新从头开始**扫描整个文件b进行匹配,若某行包含文件b中的任意名称,则将该行写入结果文件。重点解决scanner无法自动重置位置的问题。
在Java中,Scanner对象一旦读取到文件末尾(hasNextLine() 返回 false),其内部指针便停留在末尾,不会自动回退到开头——这是初学者常遇到的核心误区。因此,若需对文件B进行多次完整扫描(即每处理文件A的一行,都重新检查文件B全部内容),不能复用同一个Scanner实例,而应在每次内层循环前新建一个Scanner。
✅ 正确做法:循环内重建Scanner
每次进入内层循环时,基于同一File对象创建新的Scanner,即可确保每次都从文件B的起始位置开始读取:
import java.io.*;
import java.util.Scanner;
public class FileLineMatcher {
public static void main(String[] args) {
File fileA = new File("A.txt");
File fileB = new File("B.txt");
try (Scanner scanA = new Scanner(fileA)) {
// 外层:逐行读取A.txt
while (scanA.hasNextLine()) {
String lineFromA = scanA.nextLine().trim();
if (lineFromA.isEmpty()) continue;
// ? 关键:每次重新打开fileB → 保证从头扫描
try (Scanner scanB = new Scanner(fileB)) {
boolean matched = false;
while (scanB.hasNextLine()) {
String nameInB = scanB.nextLine().trim();
if (!nameInB.isEmpty() && lineFromA.contains(nameInB)) {
matched = true;
break; // 找到一个即满足条件,可提前退出
}
}
// 若匹配成功,追加写入结果文件
if (matched) {
try (FileWriter fw = new FileWriter("PersonList.txt", true);
BufferedWriter bw = new BufferedWriter(fw);
PrintWriter writer = new PrintWriter(bw)) {
writer.println(lineFromA); // 推荐使用println保持换行清晰
}
}
}
}
} catch (FileNotFoundException e) {
System.err.println("文件未找到: " + e.getMessage());
} catch (IOException e) {
System.err.println("IO异常: " + e.getMessage());
}
}
}⚠️ 注意事项与优化建议
- 资源管理:使用 try-with-resources(如示例所示)自动关闭Scanner、FileWriter等,避免资源泄漏,比手动调用.close()更安全可靠;
-
性能考量:若文件B较大(如 >10MB),频繁重建Scanner并重复读取磁盘会显著降低效率。此时推荐预加载文件B的所有名称到内存集合中(如HashSet
),后续仅做O(1)查找: Set
namesInB = new HashSet<>(); try (Scanner scanB = new Scanner(fileB)) { while (scanB.hasNextLine()) { String name = scanB.nextLine().trim(); if (!name.isEmpty()) namesInB.add(name); } } // 然后在外层循环中直接:if (namesInB.stream().anyMatch(lineFromA::contains)) { ... } - 语义准确性:原代码中personCheck.contains(personB)逻辑易误判(如"Bob"匹配"Robert")。如需精确匹配单词,建议改用正则或split()后遍历;若需子串匹配,请确保业务需求明确;
- 编码兼容性:若文件含中文或特殊字符,建议显式指定编码(如new Scanner(fileB, "UTF-8"))。
通过合理设计Scanner生命周期与资源管理,即可稳健实现“逐行扫描+全量比对”这一典型文本处理任务。










