讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

Meta最新图像生成工具火了，竟能把梦境画成现实！

WBOY

发布时间：2023-04-08 17:11:04

|

1705人浏览过

|

来源于51CTO.COM

转载

AI在画画这块儿，已经拿捏的死死的。

一览AI绘图

一览AI绘图

一览AI绘图是一览科技推出的AIGC作图工具，用AI灵感助力，轻松创作高品质图片

下载

近日，Meta也整了一个AI「画家」——Make-A-Scene。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

还以为只是用文字生成画作就这么简单吗？

要知道，仅是靠文字描述还有时候会「翻车」，就比如谷歌前段时间推出的「艺术家」Parti。

「一个没有香蕉的盘子，旁边有一个没有橙汁的玻璃杯。」

Meta最新图像生成工具火了，竟能把梦境画成现实！

这次，Make-A-Scene可以通过文本描述，再加上一张草图，就能生成你想要的样子。

构图上下、左右、大小、形状等各种元素都由你说了算。

就连LeCun也出来力推自家的产品了，创意就不用说了，关键还「可控」！

Make-A-Scene有多厉害，不如一起来看看。

Meta的神笔马良

光说不练，假把式！

我们这就看看，人们究竟会怎么用Make-A-Scene，来实现他们的想象力。

研究团队将和知名的人工智能艺术家一起来进行Make-A-Scene的演示环节。

艺术家团队可谓阵容强大，包括Sofia Crespo、Scott Eaton、Alexander Reben和Refik Anadol等等，这些大师都有第一手的应用生成性人工智能的使用经验。

研发团队让这些艺术家们用Make-A-Scene作为创作过程的一部分，边使用边反馈。

接下来，我们就来欣赏一下大师们用Make-A-Scene创作出的作品吧。

例如，Sofia Crespo是一位专注于自然和技术交融的艺术家。她很爱想象从来没存在过的人造生命形式感，所以她使用Make-A-Scene的素描和文本提示功能，创造了全新的「混合生物」。

比如，花形的水母。

Crespo利用它的自由绘画功能，可以快速迭代新的想法。她表示，Make-A-Scene将有助于艺术家更好地发挥创造力，能让艺术家使用更直观的界面作画。

（花型的水母）

Scott Eaton是一位艺术家、教育家和创意技术专家，他的工作是调研究当代现状和技术之间的关系。

他用Make-A-Scene作为一种构成场景的方式，通过不同的提示来探索场景的变化，比如用类似「沙漠中沉没和腐烂的摩天大楼」这种主题来强调气候危机。

（沙漠中的摩天大楼）

Alexander Reben是一位艺术家、研究人员和机器人专家。

他认为，如果能对输出有更多的掌控，确实有助于表达自己的艺术意图。他将这些工具融入了他正在进行的系列作品之中。

而对于媒体艺术家和导演Refik Anadol来说，这个工具是一种促进想象力发展、更好地探索未知领域的方式。

其实，这个原型工具不仅仅是为对艺术有兴趣的人准备的。

研究团队相信，Make-A-Scene可以帮助任何人更好地表达自己，包括那些没什么艺术细胞的人。

作为开始，研究团队向美达公司的员工提供了一部分使用权。他们正在测试并提供关于他们使用Make-A-Scene经验的反馈。

美达公司的项目经理Andy Boyatzis使用Make-A-Scene与他两岁和四岁的孩子一起创造艺术。他们用俏皮的图画把他们的想法和想象力变成了现实。

以下就是他们的作品~

一只五彩斑斓的雕塑猫~是不是很可爱。但是这个色调其实有点不忍直视，像小孩把一大坨橡皮泥瞎揉到一起。

一只乘坐火车的怪兽熊。说真的，密恐患者抓紧绕行。小编看完这张图密恐直接窜到顶了。看看这诡异的胳膊，像脸一样的身子，像眼珠子一样的轮子...

一座山峰。讲道理，这张图蛮有意境的。但有没有感觉，远处的山和近处的小火车压根不是一个画风？

背后技术

虽然目前的方法提供了文本和图像域之间还算不错的转换，但它们仍然有几个关键问题没有很好地解决：可控性、人类感知、图像质量。

该模型的方法一定程度提高了结构一致性和图像质量。

整个场景由三个互补的语义分割组（全景、人类和人脸）组成。

通过组合三个提取的语义分割组，网络学习生成语义的布局和条件，生成最终图像。

为了创建场景的token空间，作者们采用了「VQ-SEG」，这是一项对「VQ-VAE」的改进。

在该实现中，「VQ-SEG」的输入和输出都是m个通道。附加通道是分隔不同类和实例的边的映射。边缘通道为同一类的相邻实例提供分离，并强调具有高度重要性的稀缺类。

在训练「VQ-SEG」网络时，由于每个人脸部分在场景空间中所占的像素数量相对较少，因此导致了重建场景中代表人脸部分（如眼睛、鼻子、嘴唇、眉毛）的语义分割频繁减少。

对此，作者们尝试在分割人脸部分类的基础上采用加权二元交叉熵人脸损失，更加突出人脸部分的重要性。此外，还将人脸部分的边缘作为上述语义分割边缘图的一部分。

作者们采用了在ImageNet数据集上训练的预训练VGG网络，而不是专门的人脸嵌入网络，并引入了表示重建图像和真实图像之间感知差异的特征匹配损失。

通过使用特征匹配，给VQ-IMG中的encoder和decoder分别添加额外的上采样层和下采样层，便可以将输出图像的分辨率从256×256进行提高。

想必大家对Transformer并不陌生，那么基于场景的Transformer又是什么呢？

它依赖于一个具有三个独立连续的token空间的自回归Transformer，即文本、场景和图像。

token序列由BPE编码器编码的文本token、VQ-SEG编码的场景token以及VQ-IMG编码或者解码的图像token组成。

在训练基于场景的Transformer之前，每个编码好的token序列都对应一个[文本，场景，图像]元组，使用相应的encoder提取。

此外，作者们还采用了无分类器引导，即将无条件样本引导到条件样本的过程。

该模型实现了SOTA结果。具体看一下和之前方法的效果对比

现在，研究人员还将Make-A-Scene整合了一个超分辨率网络，就可以生成2048x2048、4倍分辨率的图像。

如下：

其实，与其他生成AI模型一样，Make-A-Scene通过对数百万个示例图像进行训练来学习视觉和文本之间的关系。

不可否认的是，训练数据中反映的偏差会影响这些模型的输出。

正如研究者所指出的那样，Make-A-Scene还有很多地方有待提高。

相关文章

百度搜索智能聚合怎么关百度ai搜索聚合屏蔽方法

百度AI助手如何总结年度项目成果_百度AI助手结项目法【重点】

tofai如何批量处理文件 tofai高效办公操作技巧【指南】

如何用AI一键生成游戏素材 AI游戏资产自动生成工具【教程】

通义万相AI艺术创作怎么用_通义万相AI艺术创作使用方法详细指南【教程】

相关标签:

ai

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：一文聊聊自动驾驶决策系统下一篇：超越辅助：分享一个基于GPT引擎的免费AI工具

作者最新文章

夸克浏览器AI搜索功能详解_几个实用的夸克AI搜索技巧分享

2025-10-17 17:20

手机版夸克浏览器AI搜索设置_移动端夸克AI搜索使用全攻略

2025-10-17 23:58

夸克浏览器AI搜索深度体验_夸克AI搜索与其他AI的对比

2025-10-18 22:34

夸克浏览器AI搜索入口在哪_一文读懂夸克AI搜索如何激活

2025-10-19 09:25

夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02

夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42

玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50

夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12

微信朋友圈怎么设置定时发布微信朋友圈定时发送图文教程

2026-01-02 09:14

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

php源码安装教程大全

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

129

2025.12.31

php网站源码教程大全

php网站源码教程大全

本专题整合了php网站源码相关教程，阅读专题下面的文章了解更多详细内容。

77

2025.12.31

视频文件格式

视频文件格式

本专题整合了视频文件格式相关内容，阅读专题下面的文章了解更多详细内容。

81

2025.12.31

不受国内限制的浏览器大全

不受国内限制的浏览器大全

想找真正自由、无限制的上网体验？本合集精选2025年最开放、隐私强、访问无阻的浏览器App，涵盖Tor、Brave、Via、X浏览器、Mullvad等高自由度工具。支持自定义搜索引擎、广告拦截、隐身模式及全球网站无障碍访问，部分更具备防追踪、去谷歌化、双内核切换等高级功能。无论日常浏览、隐私保护还是突破地域限制，总有一款适合你！

60

2025.12.31

出现404解决方法大全

出现404解决方法大全

本专题整合了404错误解决方法大全，阅读专题下面的文章了解更多详细内容。

444

2025.12.31

html5怎么播放视频

html5怎么播放视频

想让网页流畅播放视频？本合集详解HTML5视频播放核心方法！涵盖<video>标签基础用法、多格式兼容（MP4/WebM/OGV）、自定义播放控件、响应式适配及常见浏览器兼容问题解决方案。无需插件，纯前端实现高清视频嵌入，助你快速打造现代化网页视频体验。

15

2025.12.31

关闭win10系统自动更新教程大全

关闭win10系统自动更新教程大全

本专题整合了关闭win10系统自动更新教程大全，阅读专题下面的文章了解更多详细内容。

12

2025.12.31

阻止电脑自动安装软件教程

阻止电脑自动安装软件教程

本专题整合了阻止电脑自动安装软件教程，阅读专题下面的文章了解更多详细教程。

5

2025.12.31

html5怎么使用

html5怎么使用

想快速上手HTML5开发？本合集为你整理最实用的HTML5使用指南！涵盖HTML5基础语法、主流框架（如Bootstrap、Vue、React）集成方法，以及无需安装、直接在线编辑运行的平台推荐（如CodePen、JSFiddle）。无论你是新手还是进阶开发者，都能轻松掌握HTML5网页制作、响应式布局与交互功能开发，零配置开启高效前端编程之旅！

2

2025.12.31

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

10分钟--Midjourney创作自己的漫画

10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合

Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程

AI绘画教程

共2课时 | 0.2万人学习

最新文章

更多

lovemo官方登录入口 lovemo网页版注册入口

如何用商汤日日新写新年营销文案_商汤日日新写新年营销文案方法【转化】

通义千问怎么用一键生成文案_通义千问一键生成方法【教程】

ChatGPT如何一键生成英文邮件_ChatGPT邮件生成与语气调整【步骤】

DeepSeek生成单元测试用例教程 DeepSeek软件测试技巧

Claude怎么用新功能长文本处理_Claude长文本使用教程【指南】

百度ai聊天助手怎么关百度ai聊天机器人禁用

AI写作鱼怎样一键生成文章_AI写作鱼文章生成入口与模板选择【教程】

百度文库ai助手怎么关百度文库ai功能禁用步骤

百度搜索智能聚合怎么关百度ai搜索聚合屏蔽方法

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部