PaperWeekly｜CMB：中文医疗大模型评估基准

基于PaperWeekly 关于 CMB 中文医疗大模型评估基准的报道整理的简要摘要，补充 FreedomAI Lab 参与贡献与资源链接。

原文与来源

本文为媒体报道导读与转载整理。完整原文请访问原媒体页面；本站补充研究脉络、项目入口与 FreedomAI Lab 相关说明。

本文为媒体报道摘要，不保留完整转载内容；原文版权归原媒体与原作者所有。CMB 由香港中文大学（深圳）、深圳市大数据研究院等团队共同推动，相关作者包括王熙栋等，王本友教授和李海洲教授参与指导。FreedomAI Lab 的参与贡献主要体现在中文医疗评估基准构建、医学题库与任务组织、评测平台与开源资源维护。完整原文、论文、代码和项目入口见文末 Resources。

CMB 是面向中文医疗大模型的综合评估基准，覆盖医学考试选择题与真实病例问诊两类任务，旨在同时衡量模型的医学知识、临床推理和诊疗沟通能力。报道重点呈现了 CMB-Exam、CMB-Clin 的构建方式，以及 GPT-4、中文通用模型和医疗专用模型之间的评测差异，为中文医疗 LLM 的迭代提供更细粒度的反馈。

Resources

PaperWeekly 报道页：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/132632499
论文：https://arxiv.org/abs/2308.08833
项目：https://github.com/FreedomIntelligence/CMB
官网：https://cmedbenchmark.llmzoo.com/