DeepSeek 团队提出可扩展的“查找式记忆”，或为下一代模型的核心技术基础

霞舞

发布时间：2026-01-13 14:40:02

639人浏览过

来源于php中文网

原创

deepseek 团队正式推出新研究论文《conditional memory via scalable lookup: a new axis of sparsity for large language models》，创新性地引入“可扩展查找式记忆”机制，为大语言模型开辟了一条区别于标准 transformer 架构与 moe 范式的全新稀疏化路径。

代码仓库：https://www.php.cn/link/0d662a88ec2b5ced0ac7cba09876141c 论文原文：https://www.php.cn/link/0d662a88ec2b5ced0ac7cba09876141c/blob/main/Engram\_paper.pdf

论文指出，当前主流大模型在应对两类典型任务时存在固有低效：其一是依赖稳定、结构化知识的「查表型」任务；其二是需多步推演与符号组合的复杂推理任务。无论是 Dense Transformer 还是 MoE 架构，均需反复通过注意力层与前馈网络重建这些已知静态模式，造成大量冗余计算，本质是在“重复发明轮子”。

Engram 的核心设计基于高效哈希驱动的 N-Gram 嵌入，支持 O(1) 时间复杂度的直接记忆检索。该模块将输入 Token 序列切分为重叠 N-Gram 片段，并经由多头哈希函数映射至一个高度可扩展的静态记忆池中，实现毫秒级精准匹配。

文中特别强调，该查找过程完全独立于模型参数量——即便记忆表规模扩展至百亿甚至千亿级别，单次查询开销仍保持恒定。不同于 MoE 的“条件计算路由”，Engram 实现的是“条件记忆激活”：依据当前上下文隐状态动态决定是否调用记忆项，并通过轻量门控单元将其无缝注入主干网络流。

实验表明，Engram 模块通常部署于模型浅层（如前1/3层），专职承担高频模式复用任务，从而显著减轻深层网络的模式重建负担，使其更专注于高阶逻辑与抽象推理。在 27B 参数量基准下，DeepSeek 将原 MoE 架构中部分专家容量迁移至 Engram 记忆表，在总参数量与训练算力严格不变的前提下，模型在常识知识、多步推理、编程生成及数学解题等多类评测中均实现系统性性能跃升。

Cogram

使用AI帮你做会议笔记，跟踪行动项目

下载

DeepSeek 团队提出可扩展的“查找式记忆”，或为下一代模型的核心技术基础

X 平台技术社区普遍认为，Engram 有效缓解了模型早期层对固定模式的重复建模压力，使整体推理能力在同等深度下展现出更强的“纵深感”。有工程师进一步指出，该架构支持将超大规模记忆体外挂载至主机内存，借助确定性哈希寻址实现预取优化，大幅降低 GPU 显存占用与推理延迟。不少行业观察者预测，Engram 很有可能成为 DeepSeek 即将发布的旗舰模型「V4」的核心底层组件。

源码地址：点击下载

用数据照亮成长之路：PandaCoder Git 统计工具窗口

Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法

JetBrains 宣布 DataGrip 面向非商业用途免费

Linus 对 Git 提交信息中“Link:”标签被滥用表达不满

开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

下载

相关标签:

git github ai pdf 路由大模型区别 deepseek 架构 for Token Conditional github transformer https

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Free Fs v2.0.1发布下一篇：暂无

作者最新文章

历史演义跑团类游戏《捉刀》Steam上线获特别好评

2026-01-11 10:43

如何分析图遍历算法的空间复杂度：以邻接矩阵+BFS路径检测为例

2026-01-11 10:55

赢了才能开电脑，开发者耗时 10 个月自制 UEFI 小游戏合集

2026-01-11 10:55

视频号后台如何设置自动回复

2026-01-11 10:55

如何正确使用 Go 的 encoding/xml 包进行序列化与反序列化

2026-01-11 11:03

汉印错题app怎么打印文档-文档打印步骤

2026-01-11 11:08

全民K歌如何设置出好听音效

2026-01-11 11:08

Laravel 中正确绑定数组参数实现 WHERE IN 查询的完整指南

2026-01-11 11:14

Bootstrap 5 多卡片轮播：实现每页显示 3 张卡片的完整方案

2026-01-11 11:29

如何在 AnyChart 中通过按钮切换多组数据实现极坐标柱状图的动态展示

2026-01-11 11:31

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6082

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

799

2023.09.14