外科手术AI新突破 CAIR发布“术影”SurgMotion手术视频大模型
综合
关注3月24日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港科学园深圳分园发布“术影”SurgMotion手术视频大模型,标志着外科手术AI从“碎片化识别”向“通用化理解”的跨越式进化,为临床治疗、手术操作、医学教学及术后复盘提供有力支撑。
一众嘉宾共同见证了这一AI外科手术领域的里程碑式突破。(从左至右)香港科技园公司业务发展副总监容红强,联影智融医疗科技有限公司副总裁谢强,中山大学附属第一医院呼吸与危重症医学科副主任、主任医师廖槐,CAIR主任、研究员刘宏斌,欧洲科学院院士、慕尼黑工业大学教授及CAMP实验部主任Nassir Navab,香港大学深圳医院神经医学中心名誉顾问医师、香港大学外科学临床教授潘伟生,香港中文大学医学院外科学系名誉临床副教授及神经外科组主任陈达明,河套发展署科技与人才部副部长王元孟
从“看像素”到“懂运动”:视频原生架构的范式革命
据介绍,“术影”SurgMotion手术视频大模型是目前业内规模最大、最完整的手术视频通用智能底座,依托SurgMotion-15M数据集进行训练。该数据集涵盖约1500万帧、超3658小时的真实手术视频。基于这一海量数据,SurgMotion突破传统像素重建的局限,引入运动引导的隐空间预测机制,显著提升了模型对手术器械、解剖结构、交互动作等关键语义结构的理解能力,为多中心、多科室、多术式的通用手术智能奠定了基础。
“术影”SurgMotion大模型支持13种人类主要器官、6大类手术理解任务(工作流理解、动作理解、深度估计、息肉分割、三元组识别、技能评估),并已在17个国际权威手术AI基准上全面刷新最优纪录(SOTA)。该模型尤其在手术流程识别、器械交互理解、精细动作建模等核心任务上大幅超越现有方法,展现出极强的泛化能力与精度。
汇聚前沿洞见,共绘智慧医疗新蓝图
在致辞环节,CAIR主任、研究员刘宏斌研表示,去年CAIR发布了聆音超声大模型和多模态医疗AI大模型CARES 3.0,展现了持续创新的研发实力。今年我们隆重推出“术影”SurgMotion手术视频大模型,助力构建大湾区AI医疗的智慧生态。我们的研发始终以临床应用为核心目标,旨在赋能医生,造福患者,为构建更健康、更高效的医疗生态贡献力量。
刘宏斌研究员致辞
欧洲科学院院士、慕尼黑工业大学教授及CAMP实验部主任Nassir Navab作为该模型的重要合作方,对双方合作给予高度评价。他表示与CAIR团队的合作过程十分愉快且富有成效,并赞叹CAIR展现出的卓越研发效率与快速迭代能力。他期待未来双方继续深化合作,共同推动技术创新突破。
开源模型,构筑通用手术AI基石
在大模型发布推介环节,CAIR研究员易东正式宣布十亿参数量的“术影”SurgMotion大模型全面开源。他阐述了SurgMotion的设计理念:“手术视频中存在大量的冗余片段或干扰噪声,传统自监督学习方法容易将算力和模型容量浪费在这类低层次细节上。因此,我们在V-JEPA架构基础上引入运动引导的隐空间预测、特征多样性保持和模型稳定性保持三项技术改进,让模型更专注学习手术视频中的运动和中高层语义信息,实现了更高效的自监督训练方法。”
除技术创新以外,该研究团队还构建了目前规模最大的手术视频预训练数据集——SurgMotion-15M。该数据集汇集来自50个数据源、13个解剖区域的3658小时手术视频,涵盖腹腔镜、开腹、神经外科、眼科、耳鼻喉科等多专科场景,为模型提供了前所未有的多样性支撑。
易东研究员发布“术影”大模型
赋能临床实践,打造医患双赢新格局
“术影”SurgMotion的标准化分析能力可有效降低复杂手术的风险,显著提升临床诊断与手术操作的规范性,为各级医疗工作者提供强有力的技术支持。在应用案例演示环节, 香港大学深圳医院神经医学中心名誉顾问医师、香港大学外科学临床教授潘伟生首先介绍了“术影”SurgMotion在神经外科培训领域的应用验证。拥有35年临床经验的潘伟生表示,香港大学深圳医院作为神经外科专科培训基地,一直致力于解决复杂手术教学中传统“师带徒”模式的标准化难题。此次验证的“术影”大模型不仅在多中心临床数据中准确率高达90%,在公开的JIGSAWS手术技能评估数据集中,其评估误差(MAE)降至最低的2.649,与专家评分的相关性(Spearman)高达0.770,性能远超同类模型。凭借精准的动作解析与客观的评估能力,该系统未来将成为可靠的教学辅助工具,帮助年轻医生进行规范化的手术复盘,极大推动专科培训的数字化与标准化发展。
中山大学附属第一医院呼吸与危重症医学科副主任、主任医师廖槐则展示了该模型在呼吸介入治疗领域的应用案例。他表示,呼吸介入治疗正向着更深、更精细的方向发展,这迫切需要强大的AI视觉模型来提供技术支撑。今天发布的“术影”大模型展现了卓越的性能,在图像分割和深度估计这两项关键任务上全面领先,实现了极高的病灶勾画精度与极低的深度误差。结合中山一院真实的临床视频数据进行测试,呼吸介入治理流程识别达到85%左右的准确率,这种能真正“读懂”手术的强大感知能力,未来必将深度赋能支气管镜机器人,大幅提升临床治疗的精准度与安全性。
关于中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)
中国科学院香港创新研究院是中国科学院在香港设立的唯一直属科研机构,于2019年成立,人工智能与机器人创新中心(CAIR)是其两大科研中心之一。CAIR聚焦人工智能与生命健康的融合创新,主要围绕多模态AI大模型、具身智能机器人、智能感知技术三大方向开展研究工作,获香港InnoHK人工智能领域重点支持,是国际上为数不多的成建制开展面向医疗健康的人工智能系统技术研发与技术转化的机构之一,致力建设成为粤港澳大湾区医疗科技创新及成果转化重要基地。


