c++中如何统计单词出现次数_c++单词频率统计方法

穿越時空

发布时间：2025-10-09 15:00:01

241人浏览过

来源于php中文网

原创

使用unordered_map统计单词频率，先分词并清洗标点、转小写，再计数输出。示例用istringstream分割字符串，cleanWord去除非字母数字，toLower统一大小写，最终遍历map打印词频。

c++中如何统计单词出现次数_c++单词频率统计方法

在C++中统计单词出现次数，常用的方法是结合标准库中的 std::map 或 std::unordered_map 来记录每个单词的频率。下面是一个简单、实用的实现方式。

读取文本并分割成单词

从输入流（如字符串或文件）中读取内容，并按空格、换行等分隔符拆分出单词。可以使用 std::istringstream 配合循环自动分割。

示例代码：

#include iostream>
#include
#include
#include
#include
#include

// 将单词转为小写，避免大小写敏感
std::string toLower(const std::string& word) {
    std::string lower;
    for (char c : word) {
        lower += std::tolower(c);
    }
    return lower;
}

// 移除标点符号
std::string cleanWord(const std::string& word) {
    std::string cleaned;
    for (char c : word) {
        if (std::isalnum(c)) {
            cleaned += c;
        }
    }
    return cleaned;
}

使用 map 统计词频

将处理后的单词作为键，出现次数作为值存入 std::map 或 std::unordered_map。后者查找更快，适合大数据量。

int main() {
    std::string input = "Hello, world! Hello C++ programming. Programming is fun.";
    std::istringstream iss(input);
    std::string word;
    std::unordered_map<:string int> freq;

    while (iss >> word) {
        word = cleanWord(word);
        if (!word.empty()) {
            freq[toLower(word)]++;
        }
    }

    // 输出结果
    for (const auto& pair : freq) {
        std::cout     }

    return 0;
}

常见优化与注意事项

实际应用中需注意以下几点：

Reword

AI文章写作，一个会思考的编辑

下载

立即学习“C++免费学习笔记（深入）”；

使用 std::unordered_map 提升性能，尤其当单词数量多时
清洗数据：去除逗号、句号、引号等标点，避免 "hello" 和 "hello!" 被视为不同单词
统一大小写，通常转为小写处理
考虑是否忽略长度为0的字符串（如纯标点拆分后）
若从文件读取，用 std::ifstream 替代 std::istringstream

基本上就这些。核心思路是：分词 → 清洗 → 计数 → 输出。C++标准库提供了足够工具，无需手动实现复杂结构。

c++中如何求一个数的质因数分解_c++质因数分解算法

c++怎么实现简单加密算法XOR_c++ 位运算加密与解密原理【案例】

c++结构体struct和类class区别_c++面向对象基础

c++ long long类型范围_c++大整数溢出问题

c++中的RTTI是什么_c++运行时类型识别与dynamic_cast原理【详解】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

word 大数据工具 ai c++ ios stream 标准库 red String if for while include const auto 字符串 char int 循环 ifstream map input word

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：c++中怎么判断文件是否存在_C++文件存在性检查方法下一篇：C++如何写入文件_C++ 文件写入方法

作者最新文章

如何通过Composer.json配置项目专属的Bin执行文件？

2026-01-02 15:58

c++中如何实现B树插入操作_c++ B-Tree索引结构初探

2026-01-02 15:59

Word如何插入高清图片不模糊？Word图片插入与压缩设置【详解】

2026-01-02 15:59

sublime的颜色选择器(ColorPicker)插件如何安装和使用？ (前端必备)

2026-01-02 16:06

composer如何给项目添加自定义的命令行工具_composer的bin配置项详解【方法】

2026-01-02 16:09

Win11怎么设置多显示器壁纸_Win11双屏设置不同背景【技巧】

2026-01-02 16:17

Composer fund命令详解：如何支持你项目中依赖的开源项目？

2026-01-02 16:21

sublime怎么配置c语言环境_sublime编写c语言代码一键编译【方法】

2026-01-02 16:25

如何使用Composer show --self查看当前Composer版本的详细信息？

2026-01-02 16:30

Mac如何连接蓝牙耳机_解决Mac蓝牙设备断连问题【教程】

2026-01-02 16:31

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

313

2023.08.02

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

714

2023.08.22

while的用法

while的用法是“while 条件: 代码块”，条件是一个表达式，当条件为真时，执行代码块，然后再次判断条件是否为真，如果为真则继续执行代码块，直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容，供大家免费下载体验。

2023.09.25

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

520

2023.09.20