0

0

OpenAI提供新的微调和定制选项

王林

王林

发布时间:2024-04-19 15:19:09

|

1145人浏览过

|

来源于51CTO.COM

转载

微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可使用户大大增加模型对专业内涵的理解,允许用户为特定任务的模型增加现成知识。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OpenAI提供新的微调和定制选项

虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三倍。这一数值正如OpenAI最近宣布扩展其自定义模型程序以及为其微调API提供各种新功能所反映的那样。

自服务微调API的新特性

OpenAI于2023年8月首次宣布推出针对GPT-3的自助微调API,并受到了AI社区的热烈响应。据OpenAI报告称,成千上万的团体已经利用API来训练成千上万的模型,比如利用特定的编程语言生成代码,将文本总结为特定的格式,或根据用户行为创建个性化的内容。

自从2023年8月开始,工作匹配和招聘平台Indeed取得了重大成功。为了将求职者与相关的空缺职位相匹配,Indeed向用户发送个性化推荐。通过微调GPT 3.5 Turbo以生成更准确的流程解释,并能够将提醒中的令牌数量减少80%。这使得该公司每月发送给求职者的信息从不足100万条增加到大约2000万条。

新微调API特性建立在这个成功的基础上,希望为未来的用户改进功能:

基于epoch的检查点创建:在每个训练epoch自动生成一个完整的微调模型检查点,这减少了后续再训练的需要,特别是在过度拟合的情况下。

Comparity Playground:一个新的并行Playground UI,用于比较模型质量和性能,允许人工评估多个模型的输出或针对单个提示进行微调快照。

第三方集成:支持与第三方平台的集成(从权限重和偏差开始),使开发人员能够将详细的微调数据共享给堆栈的其余部分。

综合验证指标:能够计算整个验证数据集的损失和准确性等指标,从而更好地了解模型质量。

超级参数配置:能够从仪表板配置可用的超级参数(而不仅仅是通过API或SDK)。

微调仪表板改进:包括配置超级参数、查看更详细的训练指标以及从以前的配置中重新运行作业的能力。

基于过去的成功,OpenAI相信这些新功能将使开发人员对他们的微调工作有更细粒度的控制。

辅助微调和定制训练模型

OpenAI还在2023年11月在DevDay上发布的基础上,改进了自定义模型计划。其中一个主要变化是辅助微调的出现,这是一种利用API微调之外的有价值技术的手段,例如在更大范围内添加额外的超级参数和各种参数有效微调(PEFT)方法。

SK电信就是充分发挥这项服务潜力的一个例子。这家电信运营商在韩国拥有超过3000万用户,因此他们希望定制一种可以充当电信客户服务专家的人工智能模型。

通过与OpenAI合作对GPT-4进行微调,使其专注于韩国电信相关的对话,SK电信的对话摘要质量提高了35%,意图识别准确率提高了33%。当将他们的新微调模型与广义GPT-4进行比较时,他们的满意度得分也从3.6提高到4.5(满分5分)。

OpenAI还引入了为需要深度微调的特定领域知识模型的公司构建定制模型的能力。与法律人工智能公司Harvey的合作证明了这一功能的价值。法律工作需要大量阅读密集的文件,Harvey想用LLMs(大型语言模型)从这些文件中综合信息,并将其提交给律师进行审查。然而,许多法律是复杂的,并且依赖于上下文,Harvey希望与OpenAI合作建立一个定制训练的模型,该模型可以将新的知识和推理方法纳入基本模型。

Harvey与OpenAI合作,添加了相当于100亿令牌的数据来定制训练这个判例法模型。通过增加必要的背景深度来做出明智的法律判断,结果模型的事实性回答提高了83%。

人工智能工具从来都不是“包治百病”的解决方案。可定制性是这项技术有用性的核心,OpenAI在微调和定制训练模型方面的工作将有助于扩展已经从该工具中获得的组织。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

386

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

569

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

386

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

569

2023.08.10

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

408

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

300

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

627

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

33

2025.10.21

Java 项目构建与依赖管理(Maven / Gradle)
Java 项目构建与依赖管理(Maven / Gradle)

本专题系统讲解 Java 项目构建与依赖管理的完整体系,重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例,帮助学习者掌握 从零搭建、维护到发布 Java 工程的标准化流程,提升在实际团队开发中的工程能力与协作效率。

9

2026.01.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.1万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号