0

0

如何在单词统计中排除以数字开头的单词

花韻仙語

花韻仙語

发布时间:2026-01-12 12:02:07

|

677人浏览过

|

来源于php中文网

原创

如何在单词统计中排除以数字开头的单词

本文介绍如何准确统计字符串中不以数字开头的单词数量,通过 `split()` 方法分割单词并结合 `character.isdigit()` 进行首字符校验,避免手动遍历空格导致的逻辑错误。

在实现单词计数功能时,一个常见误区是直接通过空格数量推算单词数(如“空格数 + 1”),尤其当目标是过滤特定单词(例如以数字开头的词)时,这种思路极易出错。原代码中存在两个关键问题:

  1. 逻辑位置错误:if (Character.isDigit(Words.charAt(i))) 被放在 if (Words.charAt(i) == ' ') 的内部,但此时 i 指向的是空格字符,charAt(i) 永远不会是数字,该判断恒为 false;
  2. 计数机制缺陷:即使修复位置,单纯依赖空格计数也无法处理连续空格、首尾空格或纯数字词(如 "123")的过滤需求。

更健壮且语义清晰的方案是:先按空格切分单词,再逐个验证每个单词是否符合“非数字开头”的条件。Java 中 String.split(" ") 可将字符串拆分为单词数组(注意:对多个连续空格会生成空字符串,生产环境建议用 split("\\s+") 更鲁棒)。

以下是优化后的完整示例:

public class WordCountLab {
    public static void main(String[] args) {
        String words = "This is a test123 123";
        int wordCount = 0;

        // 使用正则 "\\s+" 处理多空格、制表符等空白字符(推荐)
        for (String word : words.split("\\s+")) {
            // 跳过空字符串(split 产生的边界空项)
            if (word.isEmpty()) continue;

            // 检查首字符是否为数字;若不是,则计入有效单词
            if (!Character.isDigit(word.charAt(0))) {
                wordCount++;
            }
        }

        System.out.println("The number of words is " + wordCount); // 输出:4
    }
}

运行结果:The number of words is 4(即 "This", "is", "a", "test123" —— 注意 "test123" 首字符 't' 是字母,符合要求;而 "123" 被排除)。

火山方舟
火山方舟

火山引擎一站式大模型服务平台,已接入满血版DeepSeek

下载

⚠️ 注意事项

  • 若输入可能含前导/尾随空格,split("\\s+") 自动忽略空项,比 split(" ") 更安全;
  • word.charAt(0) 在 word.isEmpty() 未检查时会抛 StringIndexOutOfBoundsException,务必前置空校验;
  • 如需更严格的“纯单词”定义(如排除含标点的词),可结合正则 \\b[a-zA-Z]\\w*\\b 提取,但本场景中按空格切分已满足需求。

该方法逻辑直观、可维护性强,是文本预处理中过滤类统计任务的标准实践。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

831

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

737

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

733

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

Java 项目构建与依赖管理(Maven / Gradle)
Java 项目构建与依赖管理(Maven / Gradle)

本专题系统讲解 Java 项目构建与依赖管理的完整体系,重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例,帮助学习者掌握 从零搭建、维护到发布 Java 工程的标准化流程,提升在实际团队开发中的工程能力与协作效率。

3

2026.01.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.4万人学习

C# 教程
C# 教程

共94课时 | 6.5万人学习

Java 教程
Java 教程

共578课时 | 45万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号