基于PaperWeekly 关于 CMB 中文医疗大模型评估基准的报道整理的简要摘要,补充 FreedomAI Lab 参与贡献与资源链接。
本文为媒体报道摘要,不保留完整转载内容;原文版权归原媒体与原作者所有。CMB 由香港中文大学(深圳)、深圳市大数据研究院等团队共同推动,相关作者包括王熙栋等,王本友教授和李海洲教授参与指导。FreedomAI Lab 的参与贡献主要体现在中文医疗评估基准构建、医学题库与任务组织、评测平台与开源资源维护。 完整原文、论文、代码和项目入口见文末 Resources。
CMB 是面向中文医疗大模型的综合评估基准,覆盖医学考试选择题与真实病例问诊两类任务,旨在同时衡量模型的医学知识、临床推理和诊疗沟通能力。报道重点呈现了 CMB-Exam、CMB-Clin 的构建方式,以及 GPT-4、中文通用模型和医疗专用模型之间的评测差异,为中文医疗 LLM 的迭代提供更细粒度的反馈。