0

0

c++怎么实现深度学习中的Softmax函数_c++ 数值溢出处理与向量运算【实战】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-11 11:38:02

|

476人浏览过

|

来源于php中文网

原创

必须减去最大值以保证数值稳定性:使所有指数项≤1,避免exp溢出inf或下溢0,确保至少一项为1,防止softmax输出全0或nan导致梯度崩溃。

c++怎么实现深度学习中的softmax函数_c++ 数值溢出处理与向量运算【实战】

Softmax 函数在 C++ 中的正确实现方式

直接用 exp(x) 对每个元素计算再归一化,大概率会遇到 infnan —— 尤其当输入向量含较大正值(如 100)时,exp(100) 超出 double 表示范围。关键不是“怎么写公式”,而是“怎么稳住数值”。

标准解法是减去最大值(max-shift trick):

std::vector softmax(const std::vector& logits) {
    double max_val = *std::max_element(logits.begin(), logits.end());
    std::vector exps;
    double sum = 0.0;
    for (double x : logits) {
        double exp_x = std::exp(x - max_val); // 防溢出
        exps.push_back(exp_x);
        sum += exp_x;
    }
    std::vector result;
    for (double exp_x : exps) {
        result.push_back(exp_x / sum);
    }
    return result;
}

为什么必须减去最大值?数值稳定性原理

softmax(x)_i = exp(x_i) / sum_j exp(x_j),分子分母同乘 exp(-c) 后等价于 exp(x_i - c) / sum_j exp(x_j - c)。只要 c 是常数,结果不变。选 c = max(x) 可保证:

  • 所有 x_i - c ≤ 0,所以 exp(x_i - c) ∈ (0, 1]
  • 至少有一个项为 exp(0) = 1,避免全下溢成 0
  • 不会出现 inf(除非原始输入本身是 inf

漏掉这步,在训练初期 logits 波动大时,softmax 输出可能全为 0nan,梯度直接崩掉。

立即学习C++免费学习笔记(深入)”;

用 Eigen 库做向量化加速时的常见陷阱

如果用 Eigen::VectorXd 替代 std::vector,不能直接写 exp(logits) —— 默认不自动做 max-shift。必须手动处理:

神笔马良
神笔马良

神笔马良 - AI让剧本一键成片。

下载
Eigen::VectorXd softmax_eigen(const Eigen::VectorXd& logits) {
    double max_val = logits.maxCoeff();
    Eigen::VectorXd shifted = logits.array() - max_val;
    Eigen::VectorXd exps = shifted.array().exp();
    double sum = exps.sum();
    return exps / sum;
}

注意点:

  • .array() 必须显式调用,否则 .exp() 无定义
  • logits.maxCoeff() 返回 double,不是引用;别误写成 &logits.maxCoeff()
  • logits 是空向量,maxCoeff() 会抛异常 —— 生产环境需前置检查
  • 对小向量(size ),Eigen 的开销可能比原生循环大,别盲目优化

极端情况:全 NaN 输入或含 inf 的处理策略

真实训练中,前层梯度爆炸可能导致 logitsinfnan。此时 max_elementexp 行为未定义(C++ 标准不保证),可能静默返回错误结果。

建议在 softmax 前加轻量级校验:

  • std::isnan(x)std::isinf(x) 扫描输入
  • 发现 nan 直接返回全 0 向量(或抛异常,视 pipeline 设计而定)
  • 发现 +inf:只保留该位置为 1,其余为 0(数学上合理)
  • 发现 -inf:可设为极小负数(如 -1e30)再进 softmax,避免 exp(-inf)=0 导致除零

这些分支判断成本极低,但能防止 silent failure —— 这类 bug 往往要到 loss 突然卡死才暴露,排查成本远高于预防。

相关专题

更多
c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

51

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

98

2025.10.23

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

78

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

46

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

121

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

12

2026.01.09

python学习网站
python学习网站

本专题整合了python学习相关推荐汇总,阅读专题下面的文章了解更多详细内容。

15

2026.01.09

俄罗斯手机浏览器地址汇总
俄罗斯手机浏览器地址汇总

汇总俄罗斯Yandex手机浏览器官方网址入口,涵盖国际版与俄语版,适配移动端访问,一键直达搜索、地图、新闻等核心服务。

71

2026.01.09

漫蛙稳定版地址大全
漫蛙稳定版地址大全

漫蛙稳定版地址大全汇总最新可用入口,包含漫蛙manwa漫画防走失官网链接,确保用户随时畅读海量正版漫画资源,建议收藏备用,避免因域名变动无法访问。

370

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.6万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号