0

0

C++词频统计程序 map容器统计单词频率

P粉602998670

P粉602998670

发布时间:2025-08-29 08:10:01

|

809人浏览过

|

来源于php中文网

原创

使用map统计单词频率时,程序读取文本并逐词处理,通过cleanWord和toLower函数去除标点并转为小写,以std::map存储单词及出现次数,利用其自动排序特性输出有序结果,支持扩展如频率排序或文件输入。

c++词频统计程序 map容器统计单词频率

在C++中,使用

map
容器统计单词频率是一种常见且高效的方法。通过
std::map
,我们可以自动对单词进行排序,并方便地维护每个单词出现的次数。

基本思路

程序读取输入的文本(从标准输入或文件),逐个提取单词,然后以单词为键,出现次数为值,存入

std::map
中。每次遇到一个单词,就将其对应值加1。

完整示例代码

#include 
#include 
#include 
#include 
#include 

// 将单词转为小写,避免大小写敏感
std::string toLower(const std::string& word) {
    std::string lower;
    for (char c : word) {
        lower += std::tolower(c);
    }
    return lower;
}

// 提取纯字母组成的单词,去除标点
std::string cleanWord(const std::string& word) {
    std::string cleaned;
    for (char c : word) {
        if (std::isalpha(c)) {
            cleaned += c;
        }
    }
    return cleaned;
}

int main() {
    std::map wordCount;
    std::string line;

    std::cout << "请输入文本(输入空行结束):\n";

    while (std::getline(std::cin, line) && !line.empty()) {
        std::stringstream ss(line);
        std::string word;

        while (ss >> word) {
            word = cleanWord(word);
            if (!word.empty()) {
                word = toLower(word);
                ++wordCount[word];
            }
        }
    }

    // 输出结果
    std::cout << "\n单词频率统计结果:\n";
    for (const auto& pair : wordCount) {
        std::cout << pair.first << ": " << pair.second << '\n';
    }

    return 0;
}

关键点说明

map自动排序:map会按键的字典序自动排序,输出时单词是有序的。如果不需要排序,可改用

std::unordered_map
提高性能。

大小写处理:将所有单词转为小写,避免"He"和"he"被统计为两个不同单词。

立即学习C++免费学习笔记(深入)”;

Lifetoon
Lifetoon

免费的AI漫画创作平台

下载

标点符号处理:通过

cleanWord
函数过滤掉逗号、句号等非字母字符。

输入控制:程序以空行结束输入,适合交互式使用。如需从文件读取,可将

std::cin
替换为
std::ifstream
对象。

扩展建议

可以添加功能如:限制只统计长度大于2的单词、输出频率最高的前N个单词、将结果写入文件等。也可以使用

vector
配合
sort
按频率排序输出。

基本上就这些,不复杂但容易忽略细节。掌握这个结构后,可以灵活应用到其他统计任务中。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

379

2023.09.04

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

522

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

49

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

190

2025.08.29

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

312

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

522

2024.08.29

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

65

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 5.7万人学习

C 教程
C 教程

共75课时 | 3.8万人学习

C++教程
C++教程

共115课时 | 10.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号