浙江省卫生健康信息中心、蚂蚁健康与浙江省安诊儿医学人工智能科技有限公司三方协同研发了当前规模最大的开源医疗大语言模型——antangelmed,也是迄今性能最强的开源医疗语言模型之一。
核心优势
- 权威评测表现卓越:在 OpenAI 主导的 HealthBench 医疗基准测试中,AntAngelMed 全面超越所有已公开的开源模型,并力压多个头部闭源模型;在中国本土权威医疗大模型评测平台 MedAIBench 中,综合得分位列榜首。
- 深厚的医学专业素养:AntAngelMed 依托严谨的三阶段训练范式(医疗语料持续预训练、高质量指令监督微调、基于 GRPO 的强化学习优化),系统性构建起扎实的医学知识体系、高阶临床推理能力,以及高度可靠的安全性与伦理对齐水平。
- 卓越的推理效率表现:基于 Ling-flash-2.0 的先进 MoE 架构设计,AntAngelMed 总参数量达 100B,但每次推理仅需激活约 6.1B 参数,即可媲美 40B 级稠密模型性能。在 H20 硬件环境下,其生成速度突破 200 tokens/s,同时原生支持长达 128K 的上下文窗口。
AntAngelMed 在 HealthBench 开源模型榜单中稳居首位:

据悉,该模型采用分阶段递进式训练策略:
- 第一阶段为持续预训练:以通用基座模型 Ling-flash-2.0-base 为基础,注入海量、高质、覆盖多学科的中文医学语料,夯实模型底层医学认知能力;
- 第二阶段为监督微调:整合多来源、多模态、结构化的高质量医疗指令数据,在提升通用思维链能力的同时,深度适配真实临床场景,如医患交互、辅助诊断、检验报告解读等;
- 第三阶段为双路径 GRPO 强化学习:创新引入两阶段强化学习机制——先通过“推理导向强化学习”强化逻辑推演与循证决策能力,再经由“通用能力强化学习”增强共情表达、风险识别与安全边界控制,最终实现专业能力与人文温度的有机融合。

为最大化推理效能,研发团队还针对 AntAngelMed 定制了 FP8 量化 + EAGLE3 加速方案。实测显示,在 32 并发请求下,相较标准 FP8 推理,其吞吐性能显著跃升:HumanEval 提升 71%,GSM8K 提升 45%,Math-500 更实现高达 94% 的增幅,在高性能与高稳定性之间达成精准平衡。
HuggingFace 地址:https://www.php.cn/link/892f34aa7ab656adb0cc58dbcbd08d7c
ModelScope 地址:https://www.php.cn/link/ef6f1f3af41cc9f5850d273cc86f2c21
GitHub 仓库:https://www.php.cn/link/2760f1cc32d30840f01c43ee008fa1bd
源码下载地址:点击获取










