清华AIR开源OpenBioMed Skills:45项生物医药插件打破药研工程化门槛
2026年4月5日,清华大学智能产业研究院(AIR)联合水木分子生物科技公司,在GitHub平台正式开源生物医药领域首个模块化大模型技能集——OpenBioMed Skills。该项目首批发布45项经过临床前验证的功能插件,覆盖靶点发现、分子生成、ADMET预测、晶型筛选、临床试验方案设计五大核心环节,所有代码、微调权重及标准化测试集均开放下载,许可证采用Apache 2.0协议,允许商业用途。此举被《自然·药物发现》期刊评论为“首次将药学专家隐性知识转化为可复现、可审计、可组合的计算单元”,标志着AI制药从“黑箱模型调用”迈入“白盒化工程实践”新阶段。
技术实现上,OpenBioMed Skills采用“技能即服务”(Skills-as-a-Service)架构,每个插件均封装独立推理引擎、领域词典与不确定性量化模块。例如其核心插件“TargetConfirmer”能融合UniProt蛋白结构数据、GWAS全基因组关联分析结果及单细胞空间转录组图谱,对候选靶点进行三级可信度评级(A级:已有PDB结构+临床验证配体;B级:AlphaFold2预测置信度>92%;C级:仅同源建模支持)。实测显示,在针对KRAS G12C突变抑制剂的再发现任务中,该插件将苗头化合物筛选周期从传统HTS的14周压缩至68小时,且命中率提升3.8倍。
产业化落地已初见成效:恒瑞医药宣布将OpenBioMed Skills集成至其内部AI药物发现平台“HengRui Brain”,用于加速抗肿瘤双抗分子优化;药明康德则在其苏州基地部署边缘计算节点,支持研究员通过移动端语音指令调用“CrystalPredictor”插件远程预测难溶性化合物晶型。值得关注的是,项目团队同步发布了《生物医药AI技能开发白皮书》,明确规定所有贡献插件必须通过FDA发布的AI/ML Software as a Medical Device(SaMD)验证框架,这为未来AI生成药物申报资料提供了关键合规路径。国际药政专家指出,该开源生态若能持续吸纳FDA、EMA审评指南更新,有望成为全球首个符合多国监管要求的AI药研基础设施。