阿里千问发布Qwen3.5-Omni全模态大模型，支持多语种语音交互

2026-03-30 22:16:07未知作者:广韵网

在3月30日这一天，阿里旗下的千问平台正式对外发布了其全模态大模型Qwen3.5-Omni。这一系列模型精心设计了Plus、Flash、Light三种不同尺寸的Instruct版本，以满足多样化的应用场景需求。尤为值得一提的是，Qwen3.5-Omni支持长达256k的上下文处理，展现了其强大的文本理解能力。在音频处理方面，该模型能够轻松应对超过10小时的音频输入，同时，对于音视频输入，它也能处理超过400秒的720P（1 FPS）内容，展现了其卓越的多媒体处理能力。此外，Qwen3.5-Omni在语音识别和生成方面也表现出色，能够支持113种语种和方言的语音识别，以及36种语种和方言的语音生成，为全球用户提供了更加便捷、高效的语音交互体验。目前，用户可以通过Offline API和Realtime API两种方式，轻松体验到Qwen3.5-Omni带来的智能服务。

点击展开全文