Meta千亿参数大模型OPT-IML「升级版」来了，完整模型和代码公布！

WBOY

发布时间：2023-04-11 22:31:09

1849人浏览过

来源于51CTO.COM

转载

今年五月，MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B，还对所有社区免费开放。

12月22日，该模型的更新版本OPT-IML（Open Pre-trained Transformer）正式上线，Meta称其「对2000个语言任务进行了微调，包含1750 亿个参数」，还将为非商业研究用途免费开放。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

这次更新的OPT-IML的性能表现如何，先上两张图来看看。

这次的OPT-IML创建了两种模型尺寸，分别是30B和175B。

与旧版OPT模型相比，OPT-IML在14个标准NLP评估任务中的平均表现均优于OPT。

在零次学习任务上两种模型大小分别好7%~ 和32-shot 任务分别好4%~ 和 0.4%~。

在这项研究中，研究人员描述了增加模型和基准大小如何影响指令调整决策对下游任务性能的影响。

为此他们开发了 OPT-IML Bench，这是一个相当大的指令元学习 (IML) 基准，包含2000个NLP任务，这些任务根据现有的八个基准分为任务类别。

为训练OPT-IML 30B和175B，研究人员首先从该框架的角度对应用于 OPT-30B 的指令调优决策提出了见解。

在具有不同目标和输入格式的四个评估基准（PromptSource、FLAN、Super-NaturalInstructions 和 UnifiedSKG）上，OPT-IML 在两个尺度上展示了所有三种泛化技能。

它不仅在所有基准测试中显著优于OPT，而且以极具竞争力的方式优于针对该特定基准优化的现有模型。

此外OPT-IML已经开源，Github链接小编也放在下面啦~

Github链接：https://github.com/facebookresearch/metaseq/tree/main/projects/OPT-IML

接下来通过论文来一起了解一下OPT-IML。

论文链接：https://github.com/facebookresearch/metaseq/blob/main/projects/OPT-IML/optimal_paper_v1.pdf

ChatX翻译

最实用、可靠的社交类实时翻译工具。支持全球主流的20+款社交软件的聊天应用，全球200+语言随意切换。让您彻底告别复制粘贴的翻译模式，与世界各地高效连接！

下载

研究方法

大型语言模型的指令微调已成为增强其零样本和少样本泛化能力的有效方法。在这项研究中，Meta研究人员对指令微调进行了三项重要的补充。

首先，他们编译了一个大规模的指令微调基准，其中包含来自八个数据集集合的2,000个NLP任务，按任务类型分类。

研究人员在此基准上有选择地构建评估拆分，以测试三种不同类型的模型泛化能力：

包括来自完全保留类别的任务（tasks from fully held-out categories）、来自已见类型的保留任务（held-out tasks from seen types）以及来自已见任务的保留实例（held-out instances from seen tasks）。

指令微调

对模型进行微调，以使它们与遵守说明保持一致，是目前机器学习的研究方向之一。

指令微调有两种方法。一种侧重于使用人工注释的指令和反馈对各种任务的模型进行微调；另一种，侧重于通过注释或自动向可公开访问的基准和数据集添加指令。

在本研究中，Meta AI成员专注于第二种技术，并编译了许多可公开访问的数据集，其中包含改进OPT的方法。

研究过程中，Meta成员使用来自四个基准的1836个任务，提出了类似的缩放方法。最后，在调整整个测试，以突破具有挑战性的外部基准（例如 MMLU 和 Big-Bench Hard (BBH)）性能极限的同时，研究人员描述了可能影响下游性能的各种指令调整策略的权值。

多任务学习

多任务学习是基于指令的微调 (MTL) 的一种表述。

MTL 是一种流行的范例，当与共享可比较参数或表示的类似函数结合使用时，它可以提高任务的泛化性能。

近年来，MTL已应用于众多NLP场景，主要侧重于通过利用来自相关活动的信号来提高训练任务或新领域的性能。

相比之下，基于指令的微调有助于我们提高对前所未见问题的泛化性能。它是通过指令将所有任务组合成一个概念并通过在所有任务上分配模型的权重来一起训练它们来实现的。

什么是OPT？

大型语言模型，即具有超过 1000 亿个参数的自然语言处理系统，在过去几年中改变了NLP和AI研究。

这些模型接受了大量不同文本的训练，展现出令人惊讶的新能力，可以生成创意文本、解决基本数学问题、回答阅读理解问题等等。

虽然在某些情况下，公众可以通过付费 API 与这些模型进行交互，但完整的研究访问权限仍然仅限于少数资源丰富的实验室。

这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力，阻碍了提高其鲁棒性和减轻偏见等已知问题的进展。

出于对开放科学的承诺，Meta AI于今年5月发布了Open Pretrained Transformer (OPT-175B)，这是一个具有 1750 亿参数的模型，在公共数据集上训练而成，之所以共享这个模型，Meta AI 希望更多的社区参与理解关于大模型的基本技术。

简单来说，Meta将用于人工智能研究的大型语言模型访问权限开放给大众，从而实现大模型研究的人工智能民主化。

与老版对比

根据Meta现在发布的IML版本经过微调，在自然语言任务上的表现比旧版OPT更好。

典型的语言任务包括回答问题、总结文本和翻译。

为了进行微调，研究人员使用了大约2000个自然语言任务。这些任务分为八个NLP基准（OPT-IML Bench），研究人员也提供了这些基准。

平均而言，以30B和175B模型为例，OPT-IML比OPT的零次学习准确度提高了约 6-7%。在32次学习中，300亿参数的模型准确度有显著改进，1750亿参数的模型有轻微改进。

经过对比，Meta团队发现OPT-IML的性能在所有基准测试上都优于OPT，并且在零样本和少样本学习准确度方面，比其他基于指令微调的模型更具有竞争力。

RAG技术详解：提升LLM在本地网络中的应用效率

AI学习神器：口袋里的天才，激发孩子学习兴趣

宝可梦TCG对战卡组：打造N的索罗亚克·弗洛洁丝卡组攻略

AI视频生成工具大揭秘：8个免费网站助你轻松创作

揭秘健身真相：告别健身误区，打造理想体格

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：全方位分析大模型参数高效微调，清华研究登Nature子刊下一篇：使用PyTorch进行知识蒸馏的代码示例

作者最新文章

提升效率的夸克浏览器AI搜索_夸克AI搜索高效使用秘籍

2025-10-17 16:12

夸克浏览器AI搜索功能详解_几个实用的夸克AI搜索技巧分享

2025-10-17 17:20

手机版夸克浏览器AI搜索设置_移动端夸克AI搜索使用全攻略

2025-10-17 23:58

夸克浏览器AI搜索深度体验_夸克AI搜索与其他AI的对比

2025-10-18 22:34

夸克浏览器AI搜索入口在哪_一文读懂夸克AI搜索如何激活

2025-10-19 09:25

夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02

夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42

玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50

夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档