阿里通义 qwen 团队最新宣布,qwen3-vl 系列迎来重磅升级,新增 2b 与 32b 两款密集型(dense)模型,实现从轻量级到高性能级的全面布局,全方位覆盖各类视觉语言理解应用场景。
此次发布的两个版本各具特色,满足多样化需求:
- Instruct 版本:响应迅捷、运行稳定,专为高效对话交互与工具调用场景优化;
- Thinking 版本:强化复杂推理与深度视觉理解能力,具备“看图思考”特性,轻松应对高难度任务挑战。
官方指出,Qwen3-VL-32B 在 STEM、视觉问答(VQA)、OCR、视频理解及代理任务等多个关键评测中表现卓越,超越 GPT-5 mini 和 Claude 4 Sonnet。仅凭 32B 参数量,其性能即可媲美高达 235B 的大模型,甚至在 OSWorld 任务中实现反超。
而 Qwen3-VL-2B 虽体积小巧,却展现出惊人潜力,可在极致端侧设备上流畅运行,极大降低开发与部署门槛。无论是图像识别、内容生成,还是逻辑推理与创意创作,Qwen3-VL 系列正让“理解视觉世界”变得更轻便、更快速、更智能。



截至目前,Qwen3-VL 已开源 2B、4B、8B、32B 四款 Dense 模型,以及 30B-A3B、235B-A22B 两款 MoE 架构模型。每款均提供 Instruct 与 Thinking 双版本,并配套推出 12 个 FP8 量化版本,累计开放 24 个可商用权重模型,全部免费下载使用。










