感谢网友 顺势而为、zerodert、静静的听你说 提供的重要线索!
12 月 31 日消息,小米于 2025 年 12 月 16 日正式推出开源 MoE 大模型 —— Xiaomi MiMo-V2-Flash,API 免费开放体验期延长至 15 天以上。
据多位用户确认,MiMo 团队联合小米大模型 Core 团队今日发布最新公告:原定公测限免周期已扩展至 2026 年 1 月 20 日,配套支付系统也将在公测收官前正式上线。
免费试用再延 20 天!原计划于 2025 年 12 月底截止的免费 API 使用权限,现已顺延至 2026 年 1 月 20 日 14:00(北京时间)。在此期间,所有开发者均可无门槛调用 MiMo-V2-Flash 模型 API,畅享其核心能力,涵盖高性能文本生成、智能代码理解与编写等关键场景。本次延期既是回应社区热情支持,也为更广泛收集真实场景反馈,助力我们在正式商用前完成深度性能调优、交互体验升级及全链路安全验证。支付系统即将启用预告XiaomiMiMo API 开放平台的商业化支付模块将于公测结束前正式部署,并启动约一周的灰度试运行(具体安排以官方后续通知为准)。试运行阶段将开放账户充值功能,为保障服务连续性与调用稳定性,建议用户提前完成账户预充值操作。附:模型 API 官方定价标准 国内价格:输入 ¥0.7 / 百万 token,输出 ¥2.1 / 百万 token; 海外价格:输入 $0.1 / 百万 token,输出 $0.3 / 百万 token。 更多资费细则、套餐方案及优惠活动,敬请持续关注官网更新及开放平台微信群实时推送。

Xiaomi MiMo-V2-Flash 是一款面向智能体(Agent)场景深度优化的开源 MoE 模型,总参数规模达 309B,单次推理激活参数仅 15B,主打“快、准、省”。
小米官方指出,该模型是小米自研的极致推理效率导向型 MoE 架构,采用 Hybrid 注意力机制创新设计 + 多级 MTP 推理加速技术,在主流 Agent 评测体系中稳居全球开源模型前两名;其编程能力全面超越现有全部开源竞品,表现直追顶级闭源模型 Claude 4.5 Sonnet,但推理开销仅为后者的 2.5%,响应速度则提升整整一倍。












