讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

王林

发布时间：2024-03-26 18:36:02

|

500人浏览过

|

来源于51CTO.COM

转载

在自然语言处理中，有很多信息其实是重复的。

如果能将提示词进行有效地压缩，某种程度上也相当于扩大了模型支持上下文的长度。

现有的信息熵方法是通过删除某些词或短语来减少这种冗余。

然而，基于信息熵的计算仅涵盖了文本的单向上下文，可能会忽略压缩所需的关键信息；而且，信息熵的计算方式并非完全符合压缩提示词的实际目的。

为了迎接这些挑战，清华大学和微软的研究人员共同提出了一项全新的数据处理流程，名为LLMLingua-2。其旨在从大型语言模型（LLM）中提取知识，通过压缩提示词实现信息的精炼，同时确保关键信息不会丢失。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

项目在GitHub上已经斩获3.1k星

结果显示，LLMLingua-2可以将文本长度大幅缩减至最初的20%，有效减少了处理时间和成本。

此外，与前一版本LLMLingua以及其他类似技术相比，LLMLingua 2的处理速度提高了3到6倍。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

论文地址：https://arxiv.org/abs/2403.12968

在这个过程中，原始文本首先被输入模型。

模型会评估每个词的重要性，决定是保留还是删除，同时也会考虑到词语之间的关系。

最终，模型会选择那些评分最高的词汇组成一个更简短的提示词。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

团队在包括MeetingBank、LongBench、ZeroScrolls、GSM8K和BBH在内的多个数据集上测试了LLMLingua-2模型。

尽管这个模型体积不大，但它在基准测试中取得了显著的性能提升，并且证明了其在不同的大语言模型（从GPT-3.5到Mistral-7B）和语种（从英语到中文）上具有出色的泛化能力。

系统提示：

作为一名杰出的语言学家，你擅长将较长的文段压缩成简短的表达方式，方法是去除那些不重要的词汇，同时尽可能多地保留信息。

用户提示：

请将给定的文本压缩成简短的表达形式，使得你（GPT-4）能够尽可能准确地还原原文。不同于常规的文本压缩，我需要你遵循以下五个条件：

1. 只移除那些不重要的词汇。

2. 保持原始词汇的顺序不变。

3. 保持原始词汇不变。

LogoMaker

LogoMaker

免费在线制作Logo，在几分钟内完成标志设计

下载

4. 不使用任何缩写或表情符号。

5. 不添加任何新的词汇或符号。

请尽可能地压缩原文，同时保留尽可能多的信息。如果你明白了，请对以下文本进行压缩：{待压缩文本}

压缩后的文本是：[...]

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

结果显示，在问答、摘要撰写和逻辑推理等多种语言任务中，LLMLingua-2都显著优于原有的LLMLingua模型和其他选择性上下文策略。

值得一提的是，这种压缩方法对于不同的大语言模型（从GPT-3.5到Mistral-7B）和不同的语言（从英语到中文）同样有效。

而且，只需两行代码，就可以实现LLMLingua-2的部署。

目前，该模型已经被集成到了广泛使用的RAG框架LangChain和LlamaIndex当中。

实现方法

为了克服现有基于信息熵的文本压缩方法所面临的问题，LLMLingua-2采取了一种创新的数据提炼策略。

这一策略通过从GPT-4这样的大语言模型中抽取精华信息，实现了在不损失关键内容和避免添加错误信息的前提下，对文本进行高效压缩。

提示设计

要想充分利用GPT-4的文本压缩潜力，关键在于如何设定精确的压缩指令。

也就是在压缩文本时，指导GPT-4仅移除那些在原始文本中不那么重要的词汇，同时避免在此过程中引入任何新的词汇。

这样做的目的是为了确保压缩后的文本尽可能地保持原文的真实性和完整性。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

标注与筛选

研究人员利用了从GPT-4等大语言模型中提炼出的知识，开发了一种新颖的数据标注算法。

这个算法能够对原文中的每一个词汇进行标注，明确指出在压缩过程中哪些词汇是必须保留的。

为了保证所构建数据集的高质量，他们还设计了两种质量监控机制，专门用来识别并排除那些品质不佳的数据样本。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

压缩器

最后，研究人员将文本压缩的问题转化为了一个对每个词汇（Token）进行分类的任务，并采用了强大的Transformer作为特征提取器。

这个工具能够理解文本的前后关系，从而精确地抓取对于文本压缩至关重要的信息。

通过在精心构建的数据集上进行训练，研究人员的模型能够根据每个词汇的重要性，计算出一个概率值来决定这个词汇是应该被保留在最终的压缩文本中，还是应该被舍弃。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

性能评估

研究人员在一系列任务上测试了LLMLingua-2的性能，这些任务包括上下文学习、文本摘要、对话生成、多文档和单文档问答、代码生成以及合成任务，既包括了域内的数据集也包括了域外的数据集。

测试结果显示，研究人员的方法在保持高性能的同时，减少了最小的性能损失，并且在任务不特定的文本压缩方法中表现突出。

- 域内测试（MeetingBank）

研究人员将LLMLingua-2在MeetingBank测试集上的表现与其他强大的基线方法进行了对比。

尽管他们的模型规模远小于基线中使用的LLaMa-2-7B，但在问答和文本摘要任务上，研究人员的方法不仅大幅提升了性能，而且与原始文本提示的表现相差无几。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

- 域外测试（LongBench、GSM8K和BBH）

考虑到研究人员的模型仅在MeetingBank的会议记录数据上进行了训练，研究人员进一步探索了其在长文本、逻辑推理和上下文学习等不同场景下的泛化能力。

值得一提的是，尽管LLMLingua-2只在一个数据集上训练，但在域外的测试中，它的表现不仅与当前最先进的任务不特定压缩方法相媲美，甚至在某些情况下还有过之而无不及。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

即使是研究人员的较小模型（BERT-base大小），也能达到与原始提示相当的性能，在某些情况下甚至略高于原始提示。

虽然研究人员的方法取得了可喜的成果，但与其他任务感知压缩方法（如Longbench上的LongLLMlingua）相比，研究人员的方法还存在不足。

研究人员将这种性能差距归因于它们从问题中获取的额外信息。不过，研究人员的模型具有与任务无关的特点，因此在不同场景中部署时，它是一种具有良好通用性的高效选择。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

上表4列出了使用Mistral-7Bv0.1 4作为目标LLM的不同方法的结果。

与其他基线方法相比，研究人员的方法在性能上有明显的提升，展示了其在目标LLM上良好的泛化能力。

值得注意的是，LLMLingua-2的性能甚至优于原始提示。

研究人员推测，Mistral-7B在管理长上下文方面的能力可能不如GPT-3.5-Turbo。

研究人员的方法通过提供信息密度更高的短提示，有效提高了 Mistral7B 的最终推理性能。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

上表5显示了不同系统在不同压缩比的V100-32G GPU上的延迟。

结果表明，与其他压缩方法相比，LLMLingua2的计算开销要小得多，可以实现1.6倍到2.9倍的端到端速度提升。

此外，研究人员的方法还能将GPU内存成本降低8倍，从而降低对硬件资源的需求。

上下文意识观察研究人员观察到，随着压缩率的增加，LLMLingua-2可以有效地保持与完整上下文相关的信息量最大的单词。

这要归功于双向上下文感知特征提取器的采用，以及明确朝着及时压缩目标进行优化的策略。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

研究人员观察到，随着压缩率的增加，LLMLingua-2可以有效地保持与完整上下文相关的信息量最大的单词。

这要归功于双向上下文感知特征提取器的采用，以及明确朝着及时压缩目标进行优化的策略。

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

最后研究人员让GPT-4 从 LLMLingua-2压缩提示中重构原始提示音。

结果表明，GPT-4可以有效地重建原始提示，这表明在LLMLingua-2压缩过程中并没有丢失基本信息。

相关文章

微信AI数字人能否生成朋友圈内容_微信AI数字人朋友圈文案生成与发布【攻略】

教你用AI生成室内装修效果图，提前预览你的家

教你用AI一键抠图，3秒搞定比PS还干净的背景处理

教你用AI快速生成客服标准回复话术，提升客户满意度

AI写作鱼能否一键生成演讲稿_AI写作鱼演讲结构生成与语气调整【攻略】

Github

Github

Github是一款非常实用的代码开放工具，用户可以按照自己的需求进行搜索，从而快速定位到所需的代码或项目位置，还能在软件中建立自己的代码仓库，有需要的小伙伴快来保存下载体验吧！

下载

相关标签:

微软 Token github 算法 transformer bert https 重构 gpt llama langchain

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：苹果选择百度 AI，总感觉像是谣言下一篇：10秒整理搜索结果，脑图表格一键生成，网友：搜索终于有了该有的样子

作者最新文章

告别繁琐手动创建！MezzioTooling助你高效构建现代PHP应用

2025-09-15 11:32

如何解决复杂命令行任务的痛点，使用spryker/console让PHP命令开发更高效

2025-09-15 11:55

如何高效且灵活地管理电商订单计算？Spryker/Calculation模块助你一臂之力

2025-09-15 12:32

如何高效集成在线支付功能？Composer与iyzico/iyzipay-php助你轻松搞定！

2025-09-16 10:12

还在为Magento2慢吞吞的搜索发愁？AlgoliaSearch&Discovery助你打造闪电般的用户体验！

2025-09-16 10:34

如何解决电商库存管理混乱难题？Spryker/Stock模块助你轻松搞定！

2025-09-16 11:12

快速上手夸克浏览器AI搜索_夸克AI搜索保姆级图文教程

2025-10-14 20:48

夸克浏览器AI搜索无法使用_解决夸克AI搜索问题的有效方法

2025-10-15 14:04

夸克浏览器AI搜索设置教程_夸克AI搜索功能详细开启步骤

2025-10-18 13:32

夸克浏览器AI搜索结果不准_优化夸克AI搜索设置的技巧

2025-10-26 10:58

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

登录token无效

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6027

2023.09.14

登录token无效怎么办

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

778

2023.09.14

token怎么获取

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1043

2023.12.21

token什么意思

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1062

2024.03.01

页面置换算法

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

378

2023.08.14

http与https有哪些区别

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1518

2024.08.16

苹果官网入口直接访问

苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/，该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

115

2025.12.24

拼豆图纸在线生成器

拼豆图纸在线生成器

拼豆图纸生成器有PixelBeads在线版、BeadGen和“豆图快转”；推荐通过pixelbeads.online或搜索“beadgen free online”直达官网，避开需注册的诱导页面。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

84

2025.12.24

俄罗斯搜索引擎yandex官方入口地址（最新版）

俄罗斯搜索引擎yandex官方入口地址（最新版）

Yandex官方入口网址是https://yandex.com。用户可通过网页端直连或移动端浏览器直接访问，无需登录即可使用搜索、图片、新闻、地图等全部基础功能，并支持多语种检索与静态资源精准筛选。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

553

2025.12.24

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

Git 教程

Git 教程

共21课时 | 2.2万人学习

Excel 教程

Excel 教程

共162课时 | 9.5万人学习

PHP课程

PHP课程

共137课时 | 7.8万人学习

最新文章

更多

AI一键生成可商用矢量插画

唐库AI拆书工具怎么提取人物关系_唐库AI拆书工具人物关系图谱生成方法【教程】

DeepSeek V3 处理高并发请求的性能优化方案

利用 ChatGPT 学习深度学习模型调优策略

DeepSeek在网络安全中的应用 DeepSeek漏洞分析方法

百度ai助手怎么彻底关闭百度ai助手永久关闭教程

可灵ai怎样生成短视频脚本_可灵ai脚本生成模板与分镜设置【攻略】

教你用AI一键更换证件照背景，小白也能轻松搞定

斑马AI能否离线使用部分功能_斑马AI离线模式开启与功能范围【教程】

佐糖AI抠图如何换背景_佐糖AI背景替换与自定义上传【攻略】

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部