讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

心靈之曲

发布时间：2025-09-11 13:10:01

|

825人浏览过

|

来源于php中文网

原创

thinking machines lab 发文，揭示 llm 推理过程不确定性的真相

由前 OpenAI 首席技术官 Mira Murati 创立的 Thinking Machines Lab 近日发布了其首篇技术博客：《在 LLM 推理中战胜不确定性》（"Defeating Nondeterminism in LLM Inference"）。

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

尽管将大语言模型的温度设置为 0，并使用完全相同的输入、模型和硬件，输出结果仍可能出现差异。这篇博客深入探讨了这一现象背后的原因，并提出了解决方案——如何实现 100% 可重复的大模型推理输出。

文章指出，造成这种不确定性的因素主要有两个：

1. 浮点数加法不具备结合律特性（floating-point non-associativity）

即 (a + b) + c 与 a + (b + c) 在浮点运算中可能产生不同结果。由于并行计算时求和顺序不一致，会引入微小数值偏差。不过，作者认为这并非问题的主要根源。

2. 并行计算策略的动态变化（Dynamic Parallelization Strategies）

viable

viable

基于GPT-4的AI非结构化数据分析平台

下载

这是导致输出不一致的核心原因。当 batch size、序列长度或 KV-cache 的状态发生变化时，GPU 内核可能会选择不同的并行执行路径，进而改变计算顺序，最终影响输出结果。

为解决此问题，作者提出必须确保所有关键计算内核（kernel）具备 batch-invariant 特性——无论输入批次大小或序列如何分割，计算过程和结果都应保持完全一致。

针对三大核心组件，团队提出了相应的改进方法：

RMSNorm：重构归一化计算流程，保证跨设备和批处理的一致性
矩阵乘法（Matrix Multiplication）：采用确定性算法路径，避免因分块策略不同带来的误差
注意力机制（Attention）：设计统一的并行化模式，消除 softmax 与 KV-cache 操作中的非确定性

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

实验部分，研究团队选用 Qwen3-235B-A22B-Instruct-2507 模型进行测试。在应用上述优化后，连续运行 1000 次相同请求，模型每次输出均完全一致，实现了真正意义上的确定性推理。

相关文章

罗永浩：如果不做 TNT，锤子科技可能多撑几年

谷歌 Pixel 10 支持与苹果设备双向“隔空投送”

打破生态系藩篱！Google Pixel 10率先支援对iPhone直接传档

macOS Tahoe 26.2 将为 M5 Mac 带来大幅机器学习性能提升

告别讯息海！Mac 与 iPhone 高效删除 iCloud 讯息指南一览

相关标签:

mac ai openai 大模型 qwen batch 算法重构

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：华为中国行2025·山西新质生产力大会“以数智化之笔书写长治答卷” 下一篇：月之暗面开源 Checkpoint Engine，专为 LLM 推理引擎设计的中间件

作者最新文章

iPhone 18 Pro明年见：共有12大核心卖点

2025-12-24 12:00

荣耀WIN系列支持5920Hz PWM调光：行业最高久玩不累眼

2025-12-24 12:02

苹果iPhone Fold外屏比预期更小：背后原因揭开

2025-12-24 12:07

2026首台真全面屏旗舰！红魔11 Air明年1月发布：祖传主动散热风扇回归

2025-12-24 12:11

《逆水寒》手游虚拟演唱会来了唐诗逸带玩家飞天

2025-12-24 12:18

曝《荒野大镖客2》已为次时代主机进行了优化包括Switch2

2025-12-24 12:22

瓦学弟的胜利？传《CS2》将改变皮肤获取方式

2025-12-24 12:26

《如龙极3》加入帮派养成骑摩托突袭基地玩这么大?

2025-12-24 12:40

《怪猎荒野》祭典惹人眼：你这"鸟人"胆敢消遣洒家？

2025-12-24 13:26

《羊蹄山》女主演：我的年度游戏不会是《羊蹄山》

2025-12-24 13:26

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

页面置换算法

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

378

2023.08.14

yandex外贸入口合集

yandex外贸入口合集

本专题汇总了yandex外贸入口地址，阅读下面的文章了解更多内容。

0

2025.12.24

添加脚注通用方法

添加脚注通用方法

本专题整合了添加脚注方法合集，阅读专题下面的文章了解更多内容。

1

2025.12.24

重启电脑教程汇总

重启电脑教程汇总

本专题整合了重启电脑操作教程，阅读下面的文章了解更多详细教程。

1

2025.12.24

纸张尺寸汇总

纸张尺寸汇总

本专题整合了纸张尺寸相关内容，阅读专题下面的文章了解更多内容。

1

2025.12.24

Java Spring Boot 微服务实战

Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用，内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例（如电商订单系统），帮助开发者掌握从单体应用迁移到高可用微服务系统的完整流程与实战能力。

1

2025.12.24

Python 多线程与异步编程实战

Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧，包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例，帮助学习者掌握如何构建高性能、多任务并发的 Python 应用。

1

2025.12.24

erp系统合集

erp系统合集

本专题整合了erp系统相关内容汇总，阅读下面的文章了解更多详细内容。

1

2025.12.24

Excel图表制作全流程

Excel图表制作全流程

本专题整合了excel制作图表的相关教程，阅读专题下面的文章了解更多详细内容。

14

2025.12.23

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

PostgreSQL 教程

PostgreSQL 教程

共48课时 | 5.9万人学习

好课诞生记

好课诞生记

共20课时 | 5.9万人学习

swift开发文档

swift开发文档

共33课时 | 17.5万人学习

最新文章

更多

阿里通义开源超长上下文与记忆管理模型 QwenLong-L1.5

elementary OS 8.1 默认切换至 Wayland 会话模式

全国首个规划资源大模型“云宇星空”发布

Arch Linux 取消对 NVIDIA Pascal 及更早显卡型号的默认支持

Linux Mint 22.3（代号 “Zena”）发布 Beta 版本

Jan 团队发布 Jan-v2-VL，专为长周期执行任务设计的多模态模型

“元宝xDeepSeek 年度报告”发布

苹果内部 AI 团队规模依旧庞大，其战略通过近期组织调整得到强化

Wine 11.0-rc3 发布，Windows 应用兼容层

亚马逊 Alexa+ 将新增 Angi 四大深度集成

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部