中国科学院香港创新研究院推出“术影”手术视频大模型 开源助力手术智能化发展
2026-03-26 23:20:01未知 作者:广韵网
每经特约记者:林晓晨 每经编辑:杨军
3月24日,中国科学院香港创新研究院(以下简称香港创新研究院)人工智能与机器人创新中心(CAIR)在香港科学园深圳分园举办了一场备受瞩目的发布会,正式推出了名为“术影”的手术视频大模型。据介绍,该模型是目前业内规模最大、数据最完整的手术视频通用智能平台,其数据集包含了约1500万帧、超过3658小时的真实手术视频,为手术场景的智能化研究提供了坚实的数据基础。
发布会上,香港创新研究院的易东研究员详细阐述了“术影”手术视频大模型的技术突破。他指出,该模型突破了传统像素重建的局限,通过引入运动引导的隐空间预测机制,显著提升了模型对手术器械、解剖结构以及交互动作等关键语义结构的理解能力。这一创新为多中心、多科室、多术式的通用手术智能奠定了坚实的基础,有望推动手术智能化进程迈上新台阶。
定位为医生的高级智能辅助工具
作为一款专注于手术场景的AI大模型,“术影”的核心定位是成为医生的高级决策助手。它并非旨在替代医生,而是为临床手术提供额外的“第三只眼睛”和“第二个大脑”,帮助医生在复杂多变的手术环境中做出更加精准、高效的决策。
中山大学附属第一医院呼吸与危重症医学科副主任廖槐结合自身临床经验指出,手术的难点往往不在于操作技巧,而在于决策能力。医生在手术过程中需要根据实际情况随时调整策略,这种决策能力的培养需要长时间的积累和实践。而“术影”手术视频大模型集成了海量数据,能够为医生提供更加全面、准确的决策依据。同时,在高风险手术步骤中,AI还能像“高级助手”一样提醒流程,帮助手术团队协同工作,减少沟通误差,确保手术安全顺利进行。
据易东介绍,“术影”手术视频大模型支持13种人类主要器官的手术分析,并能处理包括工作流理解、动作理解、深度估计、息肉分割、三元组识别和技能评估在内的6大类手术理解任务。在手术流程识别、器械交互理解、精细动作建模等核心任务上,该模型展现出了极强的泛化能力和精度,大幅超越了现有方法。
中国科学院香港创新研究院人工智能与机器人创新中心主任刘宏斌进一步介绍了“术影”在临床能力上的表现。他表示,该模型在标准化手术场景下,病灶部位识别准确率高达95%以上,病变性质判断准确率也达到了90%以上。此外,它还能自动提炼4级手术关键步骤、生成结构化手术报告,单一专业任务能力达到高年级医学生水平。在术中,该模型能够提供视觉辅助、步骤提示与决策依据,还可充当手术团队的“指挥家”,协调操作流程、减少信息传递误差,有效提升手术安全与效率。
香港大学深圳医院神经医学中心名誉顾问医师潘伟生对“术影”的应用前景表示了高度期待。他指出,香港大学深圳医院作为神经外科专科培训基地,一直致力于解决复杂手术教学中传统“师带徒”模式的标准化难题。而“术影”凭借其精准的动作解析与客观的评估能力,有望成为可靠的教学辅助工具,帮助年轻医生进行规范化的手术复盘,推动专科培训的数字化与标准化发展。
全面开源,促进技术迭代与数据共享
徽声在线记者在发布会现场注意到,易东还宣布了一个重要消息:10亿参数量的“术影”手术视频大模型将全面开源。这一举措旨在促进技术迭代与数据共享,推动手术智能化领域的快速发展。
易东表示,“术影”手术视频大模型基本遵循主流开源协议,既可用于商业用途,也可用于科研目的。但使用者需在使用时标注出处,以尊重原创作者的劳动成果。
据透露,该模型的训练数据中约75%为私有数据,但公开数据部分将公布详细列表。同时,私有数据的开放也在积极推进中,未来有望为更多研究者提供宝贵的数据资源。
“我们希望通过开源的方式,建立一个活跃的社区,吸引企业、医院和大学等各方参与进来。只有更多人共同参与,技术迭代和数据共享才会更快,手术智能化领域的发展也会更加迅速。”易东说。
就未来商业化与落地方面,刘宏斌回应称,“术影”手术视频大模型现阶段将优先联合产业伙伴推进临床落地。合作企业将结合自身实际探索多元化商业模式,而核心商业化路径将围绕开源生态构建展开。通过吸引全行业参与,加速技术迭代与数据共享,先在三甲医院开展临床试点,再逐步向地市、县级基层医院下沉。通过“数字分身”技术,将顶级专家的手术经验普及到基层,最终实现技术规模化普惠。
在应用场景上,刘宏斌指出,“术影”手术视频大模型现阶段将重点落地外科教学、手术质控与术中指导、基层医疗赋能三大领域。以标准化手术操作提升临床教学效率,以实时监控操作规范并辅助疑难病例决策,缓解优质医疗资源分布不均问题。未来,该模型还将向具身智能手术机器人领域延伸,实现更深度的人机协作,为手术智能化领域带来更多可能性。


