FreedomAI 倡议把 Generalist Medical AI 从单模型竞赛推进为开放、专家共治、可审计、面向真实医疗场景的社会基础设施。
医疗 AI 不是“再发布一个更大的模型”。它面对的是人的疼痛、等待、误诊风险、医疗资源不均等,以及每一次真实临床决策背后的责任。FreedomAI 正在发起 Open Medical AI Infrastructure 倡议:把通用医疗智能建设成开放、专家共治、可审计、可持续演进的公共基础设施。
今天的 Generalist Medical AI (GMAI) 已经能够读病历、看影像、理解多轮问诊、调用工具、生成诊疗建议和医学解释。但在医疗场景里,“更强的模型”并不自动等于“更可信的医疗智能”。真正稀缺的不是某一个模型参数规模,而是被医疗体系分散保存的高质量数据、专家经验、临床反馈和治理机制。
医院有纵向病程和真实工作流,基层机构有公共卫生和慢病管理经验,医学中心有高水平专科知识,患者群体有长期体验与可用性反馈,研究机构有评测和建模能力。这些资源天然分散,并且受到隐私、安全、伦理、许可、责任归属等边界约束。它们不能被简单地集中收集,也不应该被少数封闭系统独占。
这就是“沉睡的医疗数据”问题。它提醒我们:医疗 AI 的基础不只是公开数据和排行榜,而是能让医院、医生、患者、研究者、公共卫生系统和产业伙伴共同参与的基础设施。
我们的核心主张很直接:GMAI 不能被理解为单纯的 model-scaling race。医疗智能需要一个缺失的中间层,把上层通用医学模型与下层专科模型、临床工具、本地流程和真实医疗环境连接起来。
这个中间层不是一个新的封闭平台,而是一套开放、社区治理、专家背书的基础设施。它要回答四个问题:
建设可发现、可引用、可治理的医疗资源层,包括 PatientHub / Cohort Commons、证据百科、开放模型与数据目录,以及 Open GMAI License。目标不是粗暴集中数据,而是在清晰许可、脱敏、溯源、用途边界和贡献记录之上,让长期病程、队列资源、临床案例和医学知识能够被共同体负责任地使用。
用 Doctor’s Last Exam、专家持续审查、医生反馈、患者可用性反馈和安全案例库,建立“活的”医学评测体系。医疗 AI 不能只看多选题准确率,还必须看诊断推理、分诊、纵向照护、证据引用、工具调用、拒答边界和对真实工作流的适配。
通过 Medical MCP、AI-native HIS、Agentic Hospital 和医疗 API hub,把模型部署变成可审计、可授权、可回滚、有人类确认的系统工程。低风险工具可以自动调用,高风险行为必须经过明确许可和专家复核。真正的医疗智能应该能在真实流程中被测试,而不是只存在于 demo 页面里。
围绕 Happy Medical AI、医学 AI 教育、标注 fellowship、医院试点、创业基金和区域社区,形成长期维护公共基础设施的共同体。医疗 AI 的能力建设不能只服务少数技术团队,也应该让医生、医学生、患者组织、基层公共卫生人员和开发者都能理解、评测、使用和贡献。
这次演讲里有一个更具体的信号:Open Medical AI Infrastructure 不是抽象口号,而是一组可以被医院、医生、研究者和产业伙伴共同推进的项目。
这是面向前沿医疗 AI 的“活评测”。题目按月度或季度滚动更新,并配套白皮书;榜单分为 A/B 两层,A 榜公开题目但不公开答案,B 榜题目和答案都隐藏,通过提交模型来测试,尽量避免 benchmark leakage。题目以专家出题为主,同时探索智能体自动合成题目的并行 track;每道题都需要专家电子签名、rubric 评价和委员会质量审查,让评测从一次性数据集变成长期公共制度。
PatientHub 关注纵向病程和队列资源:症状、就诊、诊断、检验、影像、治疗、随访和结局应当在脱敏、许可、溯源和用途边界之下变成可复用资源。它不是把所有数据搬到一个中心,而是让病例、队列、标准化病人和医学教育样例能够被发现、引用和治理。
Agentic Hospital 把医院看成一个可模拟、可测试、可审计的环境:虚拟病人和医生、导诊与排班、医保支付、报告书写、药品购买、院内空间和全流程就诊都可以成为智能体训练与评测的一部分。演讲中也提到真实 HIS 的价值:让虚拟医院中的 AI 辅助工具能够和真实医院系统保持接口一致,在可控样例数据中先测试,再讨论进入真实流程的条件。
医疗智能体需要工具,但工具不能被随意调用。Medical MCP 的目标是把医疗 API、临床计算器、检索器、专科模型和工作流工具标准化:每个工具公开 schema、证据来源、验证状态、风险等级和权限要求;低风险工具可自动调用,高风险工具需要医生确认、日志留痕和事后审计。
医疗 AI 的社区建设要从教育开始。HappyMedicalAI 面向医疗从业人员、医学生、患者组织和开发者,提供 AI 培训、模拟病人训练、医学科普、标注和评测实践。它也连接 MedGen、HealthTTS、音视频同步数字人和全模态病人数据合成,让医学教育从静态教材走向可互动、可反馈的训练环境。
通用医疗模型不应该吞掉所有专科能力。牙科、中医、EEG、病理、影像、语音和多语言医疗模型可以像 Lego blocks 一样被路由、调用、蒸馏或融合。通专融合的关键是和专科医院、专科医生一起找到真实问题,做完即用,并把评测、科普、标注和反馈连成闭环。
数字孪生提供训练和评测环境:从虚拟细胞、器官、生命体征数据,到虚拟病人交互和虚拟医院,它们可以成为 AI 医生、真人医生和医疗智能体共同训练的环境。它的价值不是替代真实临床,而是在进入真实世界之前,把风险、流程、交互和错误模式尽可能暴露出来。
最终,开放医疗 AI 基础设施需要一个能持续运转的共同体:模型和代码开放在 GitHub / Hugging Face,医生社区共建病例、语料、评测和中医数据库,线上讲座与线下医院走访连接真实需求,医疗科普工具帮助提升公众医疗素养,产业伙伴把真实产品问题带回基础设施建设。
这些项目共同指向同一个目标:让医疗 AI 不再只是“模型发布”,而是有资源、有评测、有部署环境、有教育体系、有社区治理的长期工程。
医疗是 AI 最应该谦卑的领域之一。一个系统在论文表格里多几个百分点,不能自动转化为对患者安全的承诺;一个模型能流利回答医学问题,也不能自动获得临床部署的资格。越是接近真实医疗,越要把透明评测、专家复核、证据追踪、权限控制、审计日志、伦理许可和部署后反馈放在核心位置。
这也是 FreedomAI 对这件事的社会责任感。我们相信 AI 可以帮助缓解医疗资源不均,让基层医生获得更强的知识支持,让患者更早理解自己的风险,让医学教育更开放,让公共卫生系统更快响应复杂需求。但这种希望不能建立在不可解释、不可监督、不可共享的黑箱之上。
所以这项倡议不是宣称“AI 已经解决医疗”,而是承认医疗 AI 仍然需要漫长、严肃、共同体驱动的建设。我们需要让研究者愿意做基础设施,医生愿意参与评测,医院愿意贡献真实反馈,产业愿意把部分能力投入开放生态,政策制定者愿意支持负责任的试点和治理。
Open Medical AI Infrastructure 需要很多种贡献,而不只需要训练模型的人。
如果通用医疗智能真的要进入医院、基层、公共卫生和医学教育,它就必须以公共责任的方式被建造。FreedomAI 希望和更多临床专家、研究者、医院、企业、政策伙伴和开源社区一起,把开放医疗 AI 基础设施变成一件可以被长期信任的事情。
Towards Generalist Medical AI - HKU-SZH.pptx
包含 Generalist Medical AI 路线图、Doctor’s Last Exam、Agentic Hospital、HappyMedicalAI、Digital Twin Healthcare 等项目页。
Open Medical AI Infrastructure position paper.pdf
系统阐述 community-governed infrastructure、resource / trust / deployment / ecosystem 四层机制,以及开放医疗 AI 的治理边界。