0

0

如何统计目标单词在文本文件中出现的次数

聖光之護

聖光之護

发布时间:2026-01-04 14:50:03

|

446人浏览过

|

来源于php中文网

原创

如何统计目标单词在文本文件中出现的次数

本文详解如何使用 java 正确读取文本文件并精确统计用户指定单词在整个文件中的完整匹配次数,修正常见逻辑错误(如仅读首行、未逐行遍历、误用 `contains()` 导致子串误判等),并提供健壮、可运行的完整示例代码。

在原始代码中,存在几个关键性逻辑缺陷,直接导致计数始终为 0:

  1. 仅读取首行:szSearch = br.readLine(); 只读了一次第一行,后续未循环读取;
  2. 错误使用 contains():while (szSearch.contains(szWord)) 并非计数逻辑——它会无限循环(因 szSearch 不变)或直接跳过,且 contains() 匹配的是子字符串(如搜索 "long" 会错误匹配 "longer" 或 "belong");
  3. 未按单词边界分割:未对每行内容进行合理分词,无法实现“完整单词”匹配。

✅ 正确做法是:逐行读取 → 按空白符切分为单词数组 → 逐个比对是否完全相等(区分大小写或忽略大小写)→ 累加匹配次数

以下是修复后的完整、生产就绪代码(使用 try-with-resources 自动资源管理,增强健壮性与可读性):

import java.io.*;
import java.util.Arrays;
import java.util.Scanner;

public class WordCounter {
    public static void main(String[] args) {
        Scanner szKeyboard = new Scanner(System.in);
        System.out.print("What word are you searching for? ");
        String targetWord = szKeyboard.nextLine().trim();
        System.out.println("Searching the file...");

        int count = 0;
        String fileName = "WORDLIST.txt";

        // 使用 try-with-resources 自动关闭流,更安全简洁
        try (BufferedReader br = new BufferedReader(new FileReader(fileName))) {
            String line;
            while ((line = br.readLine()) != null) {
                // 按空白字符(空格、制表符、换行等)分割为单词
                String[] words = line.split("\\s+");
                for (String word : words) {
                    // 去除单词前后可能的标点/空格,并进行精确匹配(可选:忽略大小写用 .equalsIgnoreCase)
                    if (!word.isEmpty() && word.equals(targetWord)) {
                        count++;
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("Error: File '" + fileName + "' not found.");
        } catch (IOException e) {
            System.err.println("Error reading file: " + e.getMessage());
        } finally {
            szKeyboard.close();
        }

        System.out.println("The word \"" + targetWord + "\" appears " + count + " times in the file " + fileName + ".");
        System.out.println("\n\n--- File End ---");
    }
}

? 关键改进说明

fortran语言语法 WORD版
fortran语言语法 WORD版

本文档主要讲述的是fortran语言语法;FORTRAN是世界上最早出现的高级编程语言,是工程界最常用的编程语言,它在科学计算中(如航空航天、地质勘探、天气预报和建筑工程等领域)发挥着极其重要的作用。经过40多年的发展,伴随着FORTRAN语言多次版本的更新及相应开发系统的出现,其功能不断完善,最新版本的开发系统几乎具备了VC、VB的所有特点,如图形界面编程、数据库等。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看

下载
  • ✅ 使用 while ((line = br.readLine()) != null) 实现逐行遍历全文件
  • ✅ line.split("\\s+") 基于正则 \\s+(一个或多个空白符)准确分词,避免空字符串干扰;
  • word.equals(targetWord) 确保全词精确匹配(若需忽略大小写,替换为 word.equalsIgnoreCase(targetWord));
  • ✅ try-with-resources 替代手动 close(),杜绝资源泄漏风险;
  • ✅ 细粒度异常处理:分别捕获 FileNotFoundException 和通用 IOException,提升调试友好性。

⚠️ 注意事项

  • 若 WORDLIST.txt 中单词以逗号、句号等标点连接(如 "hello, world."),建议先用正则清洗:word = word.replaceAll("[^a-zA-Z]", "");
  • 对于超大文件,可考虑使用 Files.lines(Paths.get(fileName)) 配合 Stream API 进行函数式处理;
  • 生产环境推荐使用 Apache Commons IO 或 Guava 库简化 I/O 操作,但本例保持零依赖,纯 JDK 实现。

掌握此模式后,你不仅能准确统计单词频次,还可轻松扩展为:统计多词、生成词频表、支持正则模糊匹配等高级功能。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

829

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

733

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

733

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

396

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

java学习网站推荐汇总
java学习网站推荐汇总

本专题整合了java学习网站相关内容,阅读专题下面的文章了解更多详细内容。

6

2026.01.08

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.4万人学习

C# 教程
C# 教程

共94课时 | 6.3万人学习

Java 教程
Java 教程

共578课时 | 43.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号