阿里千问发布Qwen3.5-Omni全模态大模型,支持多语种语音交互
2026-03-30 22:16:07未知 作者:广韵网
在3月30日这一天,阿里旗下的千问平台正式对外发布了其全模态大模型Qwen3.5-Omni。这一系列模型精心设计了Plus、Flash、Light三种不同尺寸的Instruct版本,以满足多样化的应用场景需求。尤为值得一提的是,Qwen3.5-Omni支持长达256k的上下文处理,展现了其强大的文本理解能力。在音频处理方面,该模型能够轻松应对超过10小时的音频输入,同时,对于音视频输入,它也能处理超过400秒的720P(1 FPS)内容,展现了其卓越的多媒体处理能力。此外,Qwen3.5-Omni在语音识别和生成方面也表现出色,能够支持113种语种和方言的语音识别,以及36种语种和方言的语音生成,为全球用户提供了更加便捷、高效的语音交互体验。目前,用户可以通过Offline API和Realtime API两种方式,轻松体验到Qwen3.5-Omni带来的智能服务。


