哈佛研究新发现:AI大型语言模型看病 初步诊断错误率惊人

2026-04-16 00:10:12未知 作者:广韵网

徽声在线4月15日消息,近日,美国哈佛医学院的一支科研团队开展了一项针对AI大型语言模型(LLM)诊断能力的研究评估。此次评估涵盖了市面上20余种处于领先地位的AI大型语言模型,像ChatGPT、DeepSeek、Gemini以及Claude等均在其列。研究团队让这些模型依据患者初步呈现的症状和体征来进行“鉴别诊断”,也就是识别可能存在的疾病,结果发现错误率竟高达80%。不过,研究也带来了新的发现,当患者提供更多检测结果后,这些大型语言模型在“最终诊断”方面的失败率能够降低至40%左右。研究人员据此分析指出,这充分表明AI聊天机器人若要实现对疾病的精准诊断,必须获取足够全面的患者信息。倘若患者无法提供完整的健康检测信息,那么AI所给出的诊断结果往往是不可靠的。此外,研究人员着重强调,就目前情况而言,人工智能还远远没有达到能够脱离医疗专业人员的干预,就独立为患者做出诊断决策的程度。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
车展技术洞察丨亿纬锂能大圆柱电池全球扩张 固态电池研发取得突破性进展车展技术洞察丨亿纬锂能大圆柱电池全球扩张 固态电池研发取得突破性进展 车展聚焦·行业洞察丨火山引擎杨立伟谈汽车AI布局:舱驾一体是方向,但需遵循经济规律车展聚焦·行业洞察丨火山引擎杨立伟谈汽车AI布局:舱驾一体是方向,但需遵循经济规律 AI新势力崛起:一个人也能跑通一家公司,上海模速空间见证奇迹AI新势力崛起:一个人也能跑通一家公司,上海模速空间见证奇迹 徽声在线:阿里云在中国汽车公共云市场占据42%份额徽声在线:阿里云在中国汽车公共云市场占据42%份额 腾讯ima创新推出Agent模式“copilot”,引领AI新潮流腾讯ima创新推出Agent模式“copilot”,引领AI新潮流 英伟达发布Nemotron 3 Nano Omni开源模型,智能体效率飙升至竞品9倍英伟达发布Nemotron 3 Nano Omni开源模型,智能体效率飙升至竞品9倍