0

0

如何在Java中逐行扫描文件A,并对每一行都完整比对文件B中的所有内容

碧海醫心

碧海醫心

发布时间:2025-12-30 13:37:02

|

174人浏览过

|

来源于php中文网

原创

如何在Java中逐行扫描文件A,并对每一行都完整比对文件B中的所有内容

本文介绍如何用java实现:读取文件a的每一行,然后**重新从头开始**扫描整个文件b进行匹配,若某行包含文件b中的任意名称,则将该行写入结果文件。重点解决scanner无法自动重置位置的问题。

在Java中,Scanner对象一旦读取到文件末尾(hasNextLine() 返回 false),其内部指针便停留在末尾,不会自动回退到开头——这是初学者常遇到的核心误区。因此,若需对文件B进行多次完整扫描(即每处理文件A的一行,都重新检查文件B全部内容),不能复用同一个Scanner实例,而应在每次内层循环前新建一个Scanner。

✅ 正确做法:循环内重建Scanner

每次进入内层循环时,基于同一File对象创建新的Scanner,即可确保每次都从文件B的起始位置开始读取:

Rationale
Rationale

Rationale 是一款可帮助企业主、经理和个人做出艰难的决定的AI工具

下载
import java.io.*;
import java.util.Scanner;

public class FileLineMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            // 外层:逐行读取A.txt
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim();
                if (lineFromA.isEmpty()) continue;

                // ? 关键:每次重新打开fileB → 保证从头扫描
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        if (!nameInB.isEmpty() && lineFromA.contains(nameInB)) {
                            matched = true;
                            break; // 找到一个即满足条件,可提前退出
                        }
                    }

                    // 若匹配成功,追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter("PersonList.txt", true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 推荐使用println保持换行清晰
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("文件未找到: " + e.getMessage());
        } catch (IOException e) {
            System.err.println("IO异常: " + e.getMessage());
        }
    }
}

⚠️ 注意事项与优化建议

  • 资源管理:使用 try-with-resources(如示例所示)自动关闭Scanner、FileWriter等,避免资源泄漏,比手动调用.close()更安全可靠;
  • 性能考量:若文件B较大(如 >10MB),频繁重建Scanner并重复读取磁盘会显著降低效率。此时推荐预加载文件B的所有名称到内存集合中(如HashSet),后续仅做O(1)查找:
    Set namesInB = new HashSet<>();
    try (Scanner scanB = new Scanner(fileB)) {
        while (scanB.hasNextLine()) {
            String name = scanB.nextLine().trim();
            if (!name.isEmpty()) namesInB.add(name);
        }
    }
    // 然后在外层循环中直接:if (namesInB.stream().anyMatch(lineFromA::contains)) { ... }
  • 语义准确性:原代码中personCheck.contains(personB)逻辑易误判(如"Bob"匹配"Robert")。如需精确匹配单词,建议改用正则或split()后遍历;若需子串匹配,请确保业务需求明确;
  • 编码兼容性:若文件含中文或特殊字符,建议显式指定编码(如new Scanner(fileB, "UTF-8"))。

通过合理设计Scanner生命周期与资源管理,即可稳健实现“逐行扫描+全量比对”这一典型文本处理任务。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

799

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

727

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

394

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16860

2023.08.03

JavaScript 性能优化与前端调优
JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术,涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例,帮助开发者掌握 如何通过前端调优提升网站性能,减少加载时间,提高用户体验与页面响应速度。

3

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.1万人学习

C# 教程
C# 教程

共94课时 | 5.6万人学习

Java 教程
Java 教程

共578课时 | 39.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号