0

0

Gemini怎么用新功能多模态输出_Gemini多模态输出使用【步骤】

絕刀狂花

絕刀狂花

发布时间:2026-01-06 16:34:03

|

497人浏览过

|

来源于php中文网

原创

Gemini多模态输出需模型选对、输入搭准、输出设明三步协同:须用Vision/Flash Experimental标识模型;图文输入需逻辑闭环;2.5 Pro起支持JSON/CSV等结构化输出并可定义schema。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

gemini怎么用新功能多模态输出_gemini多模态输出使用【步骤】

Gemini 的多模态输出不是“看图说话”那么简单,而是让图像、文本、结构化数据协同工作。关键在于模型选对、输入搭准、输出设明——三步缺一不可。

选对支持多模态的模型

不是所有 Gemini 模型都能处理图文混合输入或生成结构化输出。必须明确选用带 VisionFlash Experimental 标识的版本:

  • Gemini Pro Vision:适用于图像理解+文本分析,比如识别截图中的表格并转成 CSV
  • Gemini 2.0 Flash Experimental(限免中):支持图像生成、风格迁移、图文联合推理
  • Gemini 2.5 Pro:新增多格式结构化输出能力,可直接返回 JSON/CSV/Markdown

构造图文并存的输入请求

上传图片不能只拖进去就问,要和文本提示形成逻辑闭环:

Lovart
Lovart

全球首个AI设计智能体

下载
  • 在网页版(gemini.google.com)点击输入框旁的“?”上传图片,再输入指令,例如:“从这张电路板照片中找出所有标有‘R’的电阻,并列出编号、位置和颜色环
  • 用 API 时,必须用 parts 字段组合图像与文本,且图像对象需放在文本之前,如:["请对比这两张B超图的异常区域", img1, img2]
  • 图片尽量用清晰原图,避免截图压缩失真;PDF 或扫描件建议先转为高分辨率 PNG/JPG 再上传

指定结构化输出格式(新功能重点)

Gemini 2.5 Pro 起支持主动控制返回格式,省去人工整理步骤:

  • 在 API 请求中设置 response_mime_type,比如 "application/json""text/csv"
  • 配合 output_schema 定义字段结构,例如要求返回商品信息时写:
    { "type": "object", "properties": { "name": {"type": "string"}, "price": {"type": "number"}, "in_stock": {"type": "boolean"} } }
  • 网页版暂不开放 schema 配置,但可在提示词中强调格式,如:“用三列表格形式输出,列名:部件名称|型号|数量,不要额外解释”

验证输出是否真正“多模态融合”

别只看文字回答漂亮就结束,要回溯检查它是否真的看了图、用了图:

  • 如果提问“图中穿红衣服的人站在哪一侧”,答案里却没提左右,说明视觉理解失效
  • 若从发票截图提取金额,结果和图中数字不一致,可能是 OCR 识别错位或模型忽略图像上下文
  • 结构化输出后,打开 JSON 或 CSV 文件,确认字段名、数据类型、空值处理是否符合预期

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

406

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

531

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

308

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

74

2025.09.10

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

299

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

219

2025.10.31

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

314

2023.08.02

java中boolean的用法
java中boolean的用法

在Java中,boolean是一种基本数据类型,它只有两个可能的值:true和false。boolean类型经常用于条件测试,比如进行比较或者检查某个条件是否满足。想了解更多java中boolean的相关内容,可以阅读本专题下面的文章。

346

2023.11.13

PPT动态图表制作教程大全
PPT动态图表制作教程大全

本专题整合了PPT动态图表制作相关教程,阅读专题下面的文章了解更多详细内容。

13

2026.01.07

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.2万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号