首页 游戏 软件 资讯 排行榜 专题
首页
编程语言
C++使用map容器统计字符串字符出现频率的详细方法

C++使用map容器统计字符串字符出现频率的详细方法

热心网友
80
转载
2026-05-06

C++如何计算字符串中每个字符出现的频率:map容器计数【干货】

C++如何计算字符串中每个字符出现的频率 _ map容器计数【干货】

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

说到统计字符串中字符的频率,一个绕不开的核心思路是:std::map 遍历计数。这种方式最直接,能自动初始化整型值为0,支持 freq[c]++ 这样的安全操作。不过,得小心别用 freq.at(c)++,否则会引发异常。它特别适用于字符集不确定,同时又需要按键有序输出的场景。

std::map 遍历计数是最直接的方式

思路很直观:直接遍历字符串,对每个字符在 map 中执行自增操作。这里有个关键细节:map 会自动初始化新键对应的值为 0(因为 int 是 POD 类型,会进行值初始化)。所以,放心使用 freq[c]++,它是安全的。

新手常犯的一个错误是误用 freq.at(c)++。这会导致 std::out_of_range 异常,因为 at() 成员函数不会自动插入不存在的键。

  • 适用场景:字符集不确定、并且需要按 ASCII 或 Unicode 顺序来遍历输出结果时。
  • 性能影响:每次插入或查找的平均时间复杂度是 O(log n),总体复杂度约为 O(N log K),其中 K 是不同字符的数量。
  • 注意 char 的有符号性:如果字符串包含扩展 ASCII 字符(值在 128–255 之间),在某些平台上,char 默认为有符号类型,这可能导致负索引。稳妥的做法是,先将字符转换为 unsigned char 再作为键。
std::map freq;
for (char c : s) {
    freq[static_cast(c)]++;
}

想更快?改用 std::unordered_map

当只关心字符频次,而不依赖输出顺序时,std::unordered_map 是更优的选择。它的平均插入和查找时间复杂度是 O(1),整体性能接近 O(N)。实测下来,对于长字符串,速度通常能快上 2 到 3 倍。

不过,也容易踩坑:unordered_map 不保证迭代顺序,并且其默认的哈希函数对 char 类型有效。但如果后续想用自定义类型作为键,就必须自己提供哈希函数和相等性比较函数。

立即学习“C++免费学习笔记(深入)”;

  • 使用场景:纯统计、后续只查询特定字符的频次、或者将结果转到 vector 后再排序。
  • 兼容性:自 C++11 起支持,无需额外头文件(但 需要显式包含)。
  • 内存开销:略高于 map,但对于几千字符以内的字符串,差异几乎可以忽略。

ASCII 字符限定下,数组替代 map 更轻量

如果能够确定输入字符串完全由 ASCII 字符组成(范围 0–127),那么直接用数组是最高效的方案。声明一个 int count[128] = {} 并初始化为零,用字符值作为下标进行访问,时间复杂度是纯粹的 O(1)。这种方式没有动态内存分配,没有哈希计算,也没有树结构开销。

一个典型的误用是:声明了 int count[128] 却没有初始化。这会导致数组内是垃圾值,统计结果完全错误。务必使用 = {}std::fill 进行清零。

  • 适用条件:输入可控(例如日志解析、协议字段处理)、字符范围明确。
  • 扩展技巧:如果字符串包含大小写字母,并且希望忽略大小写进行统计,可以先将字符统一转换为小写(tolower(c))再作为索引。
  • 越界风险:如果不校验字符 c 的范围就直接用作索引,可能会写入非法内存地址。更稳妥的做法是加一层判断:if (c >= 0 && c < 128)

遇到中文或 Unicode 字符怎么办

如果直接对包含 UTF-8 编码的中文字符串使用 std::map,会把每个字节当作独立的字符来计数。例如,“你好”会被拆分成 6 个字节分别计数,这显然是错误的。

要真正按 Unicode 码点(或者用户感知的“字”)来计数,必须先对字符串进行解码。推荐的方法是使用 std::u32string 配合解码器(注意:传统的 std::codecvt_utf8_utf16 已被弃用),或者采用更现代的方案:比如使用第三方库(如 ICU、utf8cpp),或者利用 C++20 的 配合手动解析 UTF-8 序列。

  • 简单折中方案:如果只是处理常见的中文文本,并且运行环境支持,可以使用 std::wstring 配合本地 locale。但要注意,其行为在不同平台间可能不一致。
  • 最可靠的路径:使用 utf8cpp 之类的库将 UTF-8 字符串解析为 std::vector,然后再用 unordered_map 进行统计。
  • 一个误区:不要试图直接用 for (auto c : u8string) 来遍历——在 C++20 之前,u8string 只是 string 的别名,遍历的仍然是字节。

话说回来,在实际项目中,90% 的场景使用 unordered_map 就足够了。如果真的遇到性能瓶颈,并且能确定输入是纯 ASCII,那就果断换成数组。如果碰到中文,首先要确认需求:是真的需要按“字”计数,还是按字节分析反而更符合业务本意?厘清这一点,才能选择正确的工具。

来源:https://www.php.cn/faq/2325744.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

c++如何解析MPEG-TS流中的PAT与PMT节目表【深度】
编程语言
c++如何解析MPEG-TS流中的PAT与PMT节目表【深度】

C++如何解析MPEG-TS流中的PAT与PMT节目表【深度】 PAT表是解析MPEG-TS流的关键起点,它固定位于PID为0x0000的TS包中。解析时需通过payload_unit_start_indicator标志定位新表起始,正确处理adaptation field以找到payload,校验

热心网友
05.06
C++ std::identity用法 _ 函数对象占位符与ranges算法【详解】
编程语言
C++ std::identity用法 _ 函数对象占位符与ranges算法【详解】

C++ std::identity用法详解:函数对象占位符与ranges算法核心指南 std::identity 核心概念与应用场景解析 在C++20标准库中,std::identity绝非简单的语法糖,而是std::ranges算法体系中表达“元素原样透传”意图的唯一标准函数对象。当你调用std:

热心网友
05.06
C++ std::is_base_of用法 _ 编译期检查类继承关系【干货】
编程语言
C++ std::is_base_of用法 _ 编译期检查类继承关系【干货】

std::is_base_of编译期报错解析:非法类型、不完整类型与非类类型传入的应对方案 std::is_base_of 编译期报错的根本原因 许多C++开发者在首次使用 std::is_base_of 模板时,常对其在编译阶段直接报错感到困惑。这源于其作为类型特征(type trait)的本质—

热心网友
05.06
c++如何读取和设置文件的扩展时间戳信息_出生时间提取【技巧】
编程语言
c++如何读取和设置文件的扩展时间戳信息_出生时间提取【技巧】

Linux下birth time仅能通过statx()读取且不可设置,需内核≥4 11、支持的文件系统及正确挂载选项;glibc未暴露该字段,stat()等传统接口无法获取。 Linux 下用 stat 和 utimensat 读取 设置 birth time(创建时间) 在Linux的世界里,文件

热心网友
05.06
c++ cista++序列化 c++如何进行极低延迟的对象序列化
编程语言
c++ cista++序列化 c++如何进行极低延迟的对象序列化

cista 实现微秒级序列化的核心原理:零开销内存拷贝与偏移重定位 cista 微秒级序列化的技术实现解析 cista 之所以能够实现微秒甚至纳秒级的序列化性能,源于其颠覆性的设计理念。与传统的序列化方案不同,cista 彻底摒弃了运行时类型识别(RTTI)、动态反射和堆内存分配等重型操作。它采用了

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

POE交换机连接设备后频繁重启原因解析
电脑教程
POE交换机连接设备后频繁重启原因解析

Poe交换机带载后重启:是故障,还是系统在“自救”? 不少朋友遇到过这个头疼的问题:PoE交换机一接上设备就重启。其实,这本质上不是设备坏了,而是供电系统一套精密的自我保护机制在起作用。当负载接入的瞬间,如果系统检测到功耗超标、供电不稳等情况,就会主动触发复位,防止硬件受损。这正是IEEE 802

热心网友
05.06
电饼铛选购指南哪款型号性价比最高
电脑教程
电饼铛选购指南哪款型号性价比最高

高性价比电饼铛:精准匹配、扎实可靠、真正省心 挑选一款高性价比的电饼铛,核心其实很明确:功能要精准匹配你的真实需求,材质工艺必须扎实可靠,细节设计能让你每天用着都省心。它追求的绝不是单纯的便宜或者参数漂亮,而是每一分钱都花在刀刃上。比如,2100W级的稳定火力保证了煎烤效率不打折;0氟不粘涂层配合蜂

热心网友
05.06
红米K30 5G动态壁纸不联网可以使用吗
电脑教程
红米K30 5G动态壁纸不联网可以使用吗

红米K30 5G动态壁纸联网机制全解析 关于红米K30 5G的动态壁纸是否需要一直联网,答案是:完全没必要。这玩意儿用起来其实很“懂事”,它只在你第一次上手和偶尔想换新的时候,才需要网络搭把手。 其背后的逻辑很清晰:手机搭载的MIUI系统,把所有酷炫的动态壁纸资源都放在了小米官方的“云端仓库”里。所

热心网友
05.06
vivo Y35手机桌面时间不显示修复方法
电脑教程
vivo Y35手机桌面时间不显示修复方法

vivo Y35桌面时间不显示?别急,这事儿有解 不少vivo Y35用户可能都遇到过这个情况:一觉醒来,或者换个主题之后,主屏幕上那个熟悉的“时间”不见了。先别急着怀疑手机坏了,事实是,超过八成的类似问题,根源其实很简单——时间组件压根没被“请”上桌面,或者相关的自动设置被无意中关闭了。作为一台搭

热心网友
05.06
英雄联盟手游杰斯新皮肤获取方法与实战评测
游戏攻略
英雄联盟手游杰斯新皮肤获取方法与实战评测

英雄联盟手游杰斯新皮肤外观设计酷炫,充满科技感。技能特效以蓝色能量为主,视觉效果震撼且辨识度高。实战中技能清晰、手感流畅,能提升操作自信与战场表现。整体而言,该皮肤在视觉、特效与实战体验上均表现优异,值得玩家入手。

热心网友
05.06