讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

OpenAI发布新的一致性模型，GAN速度达到18FPS，能够实时生成高质量图像。

WBOY

发布时间：2023-04-22 09:58:09

|

2911人浏览过

|

来源于51CTO.COM

转载

ChatGPT、Midjourney的火爆，让其背后技术扩散模型成为「生成式AI」革命的基础。

甚至，还受到业内研究者极力追捧，其风头远远盖过曾经逆袭天下的GAN。

就在扩散模型最能打的时候，竟有网友突然高调宣布：

Diffusion models时代终结！Consistency models加冕为王！

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

这究竟是怎么回事？？？

原来，OpenAI曾在3月发布了一篇重磅、且含金量十足的论文「Consistency Models」，并在今天在GitHub上公开了模型权重。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

论文地址：https://arxiv.org/abs/2303.01469

项目地址：https://github.com/openai/consistency_models

Batch GPT

Batch GPT

使用AI批量处理数据、自动执行任务

下载

「一致性模型」在训练速度上颠覆了扩散模型，能够『一步生成』，比扩散模型更快一个数量级完成简单任务，而且用到的计算量还要少10-2000倍。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

那么，这到底有多快呢？

有网友表示，相当于在大约3.5秒内生成64张分辨率为256x256的图像，也就是每秒18张！

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

而且，最新模型最主要优势之一，就是不需要「对抗训练」就能实现高质量样本。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

这篇研究由图灵三巨头之一Hinton学生，AlexNet的主要推动者Ilya Sutskever亲笔撰写，还有研发DALL-E 2的华人学者Mark Chen、Prafulla Dhariwal，研究内容有多硬核可想而知。

甚至还有网友称，「一致性模型」才是未来的研究方向，相信我们未来一定会嘲笑扩散模型。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

所以，扩散模型也要不存在了？

更快，更强，无需对抗

目前，这篇论文还是未定稿版本，研究还在继续中。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

2021年，OpenAI首席执行官Sam Altman曾撰写了一篇博客，讨论摩尔定律应该如何应用于所有领域。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

Altman前段时间又在推特上公开谈到了人工智能正在实现「蛙跳」。他表示，「新版摩尔定律可能很快就会出现，宇宙中的智能数量每18个月翻一番。」

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

对于其他人来说，Altman的乐观可能看起来毫无根据。

但OpenAI的首席科学家Ilya Sutskever带领团队做出的最新研究，恰恰为Altman的主张提供了强有力的支撑。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

都说2022年是AIGC元年，是因为许多模型的泉涌背后都是基于扩散模型。

扩散模型的大红大紫逐渐取代了GAN，并成为当前业界最有效的图像生成模型，就比如DALL.E 2、谷歌Imagen都是扩散模型。

然而，最新提出的「一致性模型」已被证明可以在更短的时间内，输出与扩散模型相同质量的内容。

这是因为，这种「一致性模型」采用了类似GAN的单步生成的过程。

相比之下，扩散模型采用了一种反复采样的过程，逐步消除图像中的噪声。

这种方法虽然让人印象深刻，但需要依赖执行一百到数千步的步骤才能取得良好的结果，不仅操作成本高，而且速度慢。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

扩散模型的持续迭代生成过程，比「一致性模型」消耗的计算量要多10-2000倍，甚至减慢了训练过程中的推理速度。

「一致性模型」强大之处在于，必要时能够在样本质量和计算资源两者间进行权衡。

此外，这个模型还能够执行零样本的数据编辑任务，比如图像修补，着色或笔触引导的图像编辑。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

使用在LSUN Bedroom 256^256上通过蒸馏训练的一致性模型进行零样本图像编辑

「一致性模型」还能在使用数学方程时将数据转换成噪声，并确保结果输出对于相似数据点是一致的，从而实现它们之间的平滑过渡。

这类方程称为「概率流常微分方程」（Probability Flow ODE）。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

这项研究将这类模型命名为「一致性」，因为它们在输入数据和输出数据之间保持了这种自洽性。

这些模型既可以在蒸馏模式（distillation mode）下训练，也可以在分离模式（isolation mode）下训练。

在蒸馏模式中，模型能够从预训练的扩散模型中提取数据，使其能够在单个步骤中执行。

在分离模式下，模型完全不依赖于扩散模型，从而使其成为一种完全独立的模型。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

值得注意的是，这两种训练方法都将「对抗训练」从中删除。

不得不承认，对抗训练确实会产生更强大的神经网络，但其过程是较为迂回。即它引入一组被错误分类的对抗性样本，然后用正确的标签重新训练目标神经网络。

因此，对抗训练这种方式也会导致深度学习模型预测的准确性略有下降，甚至它可能在机器人应用中带来意想不到的副作用。

实验结果表明，用于训练「一致性模型」的蒸馏技术优于用于扩散模型的。

「一致性模型」在 CIFAR10图像集和 ImageNet 64x64数据集上，分别获得了3.55和6.20的最新最先进的FID分数。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

这简直就是实现了，扩散模型的质量 + GAN的速度，双重完美。

2月份，Sutskever曾发布了一条推文暗示，

许多人认为伟大的AI进步必须包含一个新的「想法」。但事实并非如此：许多AI的最伟大进步都是以这样的形式出现的，嗯，原来这个熟悉的不起眼的想法，如果做得好，会变得令人难以置信。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

最新研究正好证明了这一点，基于旧概念的微调可以改变一切。

作者介绍

作为OpenAI的联合创始人兼首席科学家，Ilya Sutskever无须赘述，看看这张「顶级扛把子」大合照就够了。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

（图片最右）

Yang Song（宋飏）

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

论文一作宋飏，是OpenAI的研究科学家。

此前，他在清华大学获得数学和物理学学士学位，并在斯坦福大学获得了计算机科学硕士和博士学位。此外，他还在谷歌大脑、Uber ATG和微软研究院做过实习。

作为一名机器学习的研究人员，他专注于开发可扩展的方法来建模、分析和生成复杂的高维数据。他的兴趣横跨多个领域，包括生成建模、表征学习、概率推理、人工智能安全和AI for science。

Mark Chen

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

Mark Chen是OpenAI多模态和前沿研究部门的负责人，同时也是美国计算机奥林匹克队的教练。

此前，他在麻省理工学院获得了数学与计算机科学学士学位，并曾在几家自营交易公司（包括Jane Street Capital）担任量化交易员。

加入OpenAI后，他带领团队开发了DALL-E 2，并将视觉引入到GPT-4中。此外，他还领导了Codex的开发，参与了GPT-3项目，并创建了Image GPT。

Prafulla Dhariwal

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

Prafulla Dhariwal是OpenAI的一名研究科学家，从事生成模型和无监督学习。在此之前，他是麻省理工学院的一名本科生，学习计算机、数学和物理学。

有趣的是，扩散模型可以在图像生成领域吊打GAN，正是他在2021年的NeurIPS论文中提出的。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

网友：终于做了回Open AI

OpenAI今天开放了一致性模型源代码。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

终于做回了Open AI。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

面对每天太多疯狂突破和宣布。网友发问：我们是稍作休息，还是加速前进？

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

与扩散模型相比，这将大大节约研究人员训练模型的节约成本。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

还有网友给出了「一致性模型」的未来用例：实时编辑、NeRF渲染、实时游戏渲染。

目前倒是没有demo演示，但值得确定的能够实现图像生成的速度大幅提升总是赢家。

我们直接从拨号升级到宽带了。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

脑机接口，外加几乎实时生成的超逼真图像。

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

相关文章

批改网AI检测工具如何查看语法错误_批改网AI检测工具语法错误定位与修正建议【攻略】

怎么用AI帮你写出符合品牌调性的社交媒体内容日历？

不会写活动策划案？教你用AI一键生成完整方案，从创意到落地

百度ai助手太烦了怎么关百度ai助手一键屏蔽神器

豆包AI怎样写影评提示词_豆包AI影评提示词角度与结构【技巧】

相关标签:

ai chatgpt midjourney for 接口 github 人工智能 gpt-3 gpt-4 chatgpt Imagen https AIGC gpt midjourney

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：总结基于GPT-4的自治系统：AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL 下一篇：DeepMind重启"二次反击战"，宣布将挑战李世石！

作者最新文章

提升效率的夸克浏览器AI搜索_夸克AI搜索高效使用秘籍

2025-10-17 16:12

夸克浏览器AI搜索功能详解_几个实用的夸克AI搜索技巧分享

2025-10-17 17:20

手机版夸克浏览器AI搜索设置_移动端夸克AI搜索使用全攻略

2025-10-17 23:58

夸克浏览器AI搜索深度体验_夸克AI搜索与其他AI的对比

2025-10-18 22:34

夸克浏览器AI搜索入口在哪_一文读懂夸克AI搜索如何激活

2025-10-19 09:25

夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02

夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42

玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50

夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

硬盘接口类型介绍

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

989

2023.10.19

PHP接口编写教程

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

50

2025.10.17

php8.4实现接口限流的教程

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

208

2025.12.29

人工智能在生活中的应用

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

401

2023.08.17

人工智能的基本概念是什么

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

290

2024.01.09

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

620

2024.09.10

Python 人工智能

Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用，系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例（如房价预测、图像分类、文本情感分析），帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

32

2025.10.21

ChatGPT注册

ChatGPT注册

ChatGPT注册方法：1、访问OpenAI的官方网站，进入注册页面；2、完成注册后收到一份邮件，打开后点击验证账号；3、选择一个适合您需求的订阅计划；4、获得访问ChatGPT的权限即可。

523

2023.09.12

php源码安装教程大全

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

10分钟--Midjourney创作自己的漫画

10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合

Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程

AI绘画教程

共2课时 | 0.2万人学习

最新文章

更多

AI室内设计生成工具有哪些_一键生成装修效果图的AI工具推荐

ChatGPT求职指令大全：如何用AI通过大厂简历初筛

ChatGPT怎么用一键生成旅行攻略_ChatGPT攻略生成方法【方法】

AI商品描述生成工具有哪些_一键生成电商详情页的AI工具推荐

Gemini怎么用新功能图片生成_Gemini图片生成使用【教程】

Gemini怎么用新功能图片理解_Gemini图片理解使用指南【方法】

为什么你的简历石沉大海？试试用AI重写求职信提高面试率

Midjourney怎样用参数调构图_Midjourney构图调整技巧【指南】

ChatGPT怎样用提示词限格式输出_ChatGPT格式限定步骤【方法】

lovemo怎么生成特定脸型 lovemo面部特征描述技巧【实用】

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部