Open Medical AI Infrastructure: 让通用医疗智能成为公共责任

FreedomAI 倡议把 Generalist Medical AI 从单模型竞赛推进为开放、专家共治、可审计、面向真实医疗场景的社会基础设施。

医疗 AI 不是“再发布一个更大的模型”。它面对的是人的疼痛、等待、误诊风险、医疗资源不均等，以及每一次真实临床决策背后的责任。FreedomAI 正在发起 Open Medical AI Infrastructure 倡议：把通用医疗智能建设成开放、专家共治、可审计、可持续演进的公共基础设施。

医疗 AI 的真正难题

今天的 Generalist Medical AI (GMAI) 已经能够读病历、看影像、理解多轮问诊、调用工具、生成诊疗建议和医学解释。但在医疗场景里，“更强的模型”并不自动等于“更可信的医疗智能”。真正稀缺的不是某一个模型参数规模，而是被医疗体系分散保存的高质量数据、专家经验、临床反馈和治理机制。

医院有纵向病程和真实工作流，基层机构有公共卫生和慢病管理经验，医学中心有高水平专科知识，患者群体有长期体验与可用性反馈，研究机构有评测和建模能力。这些资源天然分散，并且受到隐私、安全、伦理、许可、责任归属等边界约束。它们不能被简单地集中收集，也不应该被少数封闭系统独占。

Sleeping medical data: 高价值医疗数据和专家知识大部分沉在水面之下。真正的问题不是有没有数据，而是如何让它们在隐私、许可、专家审查和公共利益的框架下被发现、连接、验证和使用。

这就是“沉睡的医疗数据”问题。它提醒我们：医疗 AI 的基础不只是公开数据和排行榜，而是能让医院、医生、患者、研究者、公共卫生系统和产业伙伴共同参与的基础设施。

倡议的核心

我们的核心主张很直接：GMAI 不能被理解为单纯的 model-scaling race。医疗智能需要一个缺失的中间层，把上层通用医学模型与下层专科模型、临床工具、本地流程和真实医疗环境连接起来。

这个中间层不是一个新的封闭平台，而是一套开放、社区治理、专家背书的基础设施。它要回答四个问题：

哪些医疗资源可以被发现、复用和负责任地共享？
哪些模型和系统在临床意义上可信，而不只是答题准确？
哪些工具、接口和部署流程可以被审计、授权和持续改进？
哪个共同体来维护标准、教育新人、资助公共项目，并对长期风险负责？

一句话总结 Open Medical AI Infrastructure 要把医疗 AI 从“模型能力展示”推进到“共同体可治理的医疗基础设施”。它既需要 serious research，也需要 real community。

The Framework of GMAI: 通用医疗模型、专科模型与临床工具之间需要一个 community-governed infrastructure。这个缺失层由资源、信任、部署和共同体生态四部分组成。

四层基础设施

1. Resource Infrastructure

建设可发现、可引用、可治理的医疗资源层，包括 PatientHub / Cohort Commons、证据百科、开放模型与数据目录，以及 Open GMAI License。目标不是粗暴集中数据，而是在清晰许可、脱敏、溯源、用途边界和贡献记录之上，让长期病程、队列资源、临床案例和医学知识能够被共同体负责任地使用。

2. Trust Infrastructure

用 Doctor’s Last Exam、专家持续审查、医生反馈、患者可用性反馈和安全案例库，建立“活的”医学评测体系。医疗 AI 不能只看多选题准确率，还必须看诊断推理、分诊、纵向照护、证据引用、工具调用、拒答边界和对真实工作流的适配。

3. Deployment Infrastructure

通过 Medical MCP、AI-native HIS、Agentic Hospital 和医疗 API hub，把模型部署变成可审计、可授权、可回滚、有人类确认的系统工程。低风险工具可以自动调用，高风险行为必须经过明确许可和专家复核。真正的医疗智能应该能在真实流程中被测试，而不是只存在于 demo 页面里。

4. Community Ecosystem

围绕 Happy Medical AI、医学 AI 教育、标注 fellowship、医院试点、创业基金和区域社区，形成长期维护公共基础设施的共同体。医疗 AI 的能力建设不能只服务少数技术团队，也应该让医生、医学生、患者组织、基层公共卫生人员和开发者都能理解、评测、使用和贡献。

具体项目如何落地

这次演讲里有一个更具体的信号：Open Medical AI Infrastructure 不是抽象口号，而是一组可以被医院、医生、研究者和产业伙伴共同推进的项目。

Doctor’s Last Exam

这是面向前沿医疗 AI 的“活评测”。题目按月度或季度滚动更新，并配套白皮书；榜单分为 A/B 两层，A 榜公开题目但不公开答案，B 榜题目和答案都隐藏，通过提交模型来测试，尽量避免 benchmark leakage。题目以专家出题为主，同时探索智能体自动合成题目的并行 track；每道题都需要专家电子签名、rubric 评价和委员会质量审查，让评测从一次性数据集变成长期公共制度。

PatientHub / Cohort Commons

PatientHub 关注纵向病程和队列资源：症状、就诊、诊断、检验、影像、治疗、随访和结局应当在脱敏、许可、溯源和用途边界之下变成可复用资源。它不是把所有数据搬到一个中心，而是让病例、队列、标准化病人和医学教育样例能够被发现、引用和治理。

Agentic Hospital + AI-native HIS

Agentic Hospital 把医院看成一个可模拟、可测试、可审计的环境：虚拟病人和医生、导诊与排班、医保支付、报告书写、药品购买、院内空间和全流程就诊都可以成为智能体训练与评测的一部分。演讲中也提到真实 HIS 的价值：让虚拟医院中的 AI 辅助工具能够和真实医院系统保持接口一致，在可控样例数据中先测试，再讨论进入真实流程的条件。

Medical MCP

医疗智能体需要工具，但工具不能被随意调用。Medical MCP 的目标是把医疗 API、临床计算器、检索器、专科模型和工作流工具标准化：每个工具公开 schema、证据来源、验证状态、风险等级和权限要求；低风险工具可自动调用，高风险工具需要医生确认、日志留痕和事后审计。

HappyMedicalAI

医疗 AI 的社区建设要从教育开始。HappyMedicalAI 面向医疗从业人员、医学生、患者组织和开发者，提供 AI 培训、模拟病人训练、医学科普、标注和评测实践。它也连接 MedGen、HealthTTS、音视频同步数字人和全模态病人数据合成，让医学教育从静态教材走向可互动、可反馈的训练环境。

Specialized Models as Tools

通用医疗模型不应该吞掉所有专科能力。牙科、中医、EEG、病理、影像、语音和多语言医疗模型可以像 Lego blocks 一样被路由、调用、蒸馏或融合。通专融合的关键是和专科医院、专科医生一起找到真实问题，做完即用，并把评测、科普、标注和反馈连成闭环。

Digital Twin for Healthcare

数字孪生提供训练和评测环境：从虚拟细胞、器官、生命体征数据，到虚拟病人交互和虚拟医院，它们可以成为 AI 医生、真人医生和医疗智能体共同训练的环境。它的价值不是替代真实临床，而是在进入真实世界之前，把风险、流程、交互和错误模式尽可能暴露出来。

Open Community Ecosystem

最终，开放医疗 AI 基础设施需要一个能持续运转的共同体：模型和代码开放在 GitHub / Hugging Face，医生社区共建病例、语料、评测和中医数据库，线上讲座与线下医院走访连接真实需求，医疗科普工具帮助提升公众医疗素养，产业伙伴把真实产品问题带回基础设施建设。

这些项目共同指向同一个目标：让医疗 AI 不再只是“模型发布”，而是有资源、有评测、有部署环境、有教育体系、有社区治理的长期工程。

我们为什么必须认真

医疗是 AI 最应该谦卑的领域之一。一个系统在论文表格里多几个百分点，不能自动转化为对患者安全的承诺；一个模型能流利回答医学问题，也不能自动获得临床部署的资格。越是接近真实医疗，越要把透明评测、专家复核、证据追踪、权限控制、审计日志、伦理许可和部署后反馈放在核心位置。

这也是 FreedomAI 对这件事的社会责任感。我们相信 AI 可以帮助缓解医疗资源不均，让基层医生获得更强的知识支持，让患者更早理解自己的风险，让医学教育更开放，让公共卫生系统更快响应复杂需求。但这种希望不能建立在不可解释、不可监督、不可共享的黑箱之上。

所以这项倡议不是宣称“AI 已经解决医疗”，而是承认医疗 AI 仍然需要漫长、严肃、共同体驱动的建设。我们需要让研究者愿意做基础设施，医生愿意参与评测，医院愿意贡献真实反馈，产业愿意把部分能力投入开放生态，政策制定者愿意支持负责任的试点和治理。

我们的边界 这是一个研究议程和行动倡议，不是已经被充分验证的临床解决方案。越是面向医疗，我们越应该把谨慎、审计和共同体治理写进系统设计本身。

加入这件事

Open Medical AI Infrastructure 需要很多种贡献，而不只需要训练模型的人。

机器学习研究者可以贡献医学评测协议、开放模型、工具调用框架、安全红队方法和可复现实验。
医生、医学教师和医院可以共同设计 Doctor’s Last Exam，提供去标识化案例、工作流反馈和专家审查。
医疗机构和公共卫生系统可以参与 PatientHub、队列资源和部署试点，把真实需求变成可治理的基础设施问题。
产业伙伴和创业团队可以把工具接入 Medical MCP，公开 schema、适用边界、验证状态和风险等级。
医学生、患者组织和开发者社区可以参与 Happy Medical AI，把医学 AI 教育、标注、评测和本地化带到更多地区。

Build resources.
让沉睡的数据、案例、工具和医学知识被发现、被许可、被追踪。 Build trust.
让评测从静态 benchmark 走向专家共治、持续更新、面向真实安全问题。 Build community.
让医疗 AI 成为共同体长期维护的公共能力，而不是短期模型竞赛。

如果通用医疗智能真的要进入医院、基层、公共卫生和医学教育，它就必须以公共责任的方式被建造。FreedomAI 希望和更多临床专家、研究者、医院、企业、政策伙伴和开源社区一起，把开放医疗 AI 基础设施变成一件可以被长期信任的事情。

资料下载

演讲 PPT

Towards Generalist Medical AI - HKU-SZH.pptx
包含 Generalist Medical AI 路线图、Doctor’s Last Exam、Agentic Hospital、HappyMedicalAI、Digital Twin Healthcare 等项目页。

倡议论文 PDF

Open Medical AI Infrastructure position paper.pdf
系统阐述 community-governed infrastructure、resource / trust / deployment / ecosystem 四层机制，以及开放医疗 AI 的治理边界。