阿里推出全模态大模型qwen3.5-omni

2026年3月30日,阿里巴巴在人工智能领域又搞了个大新闻,正式推出了自家的新一代全模态大模型Qwen3.5-Omni。这款东西不光技术突破特别大,关键是它在理解和处理音视频方面特别强,直接在215项任务里拿了个性能第一,把隔壁的Gemini-3.1Pro都给超越了,一下子成了全球最牛的全模态大模型之一。 首先,随着人工智能技术疯涨,全模态大模型变得越来越火,这类模型能搞文字、声音、视频这些乱七八糟的数据,生成和理解能力特别猛。阿里这回推出的Qwen3.5-Omni,尤其是在理解音视频、实时交互这些地方,简直就是把之前的玩法全都给玩明白了。 具体来看,这个Qwen3.5-Omni处理音视频那是相当厉害。你给它个视频或者音频,它能立马分析出来并给出详细的描述。这对短视频和直播来说简直太好用了,创作者效率立马翻倍。而且它还能识别113种语言和方言,不管你是用普通话还是用哪儿的方言说话,它都能听得懂。这样一来,不管是做国际业务还是做地方小生意,都能用得上。 发布会上阿里还特意提到了个新功能叫“音视频VibeCoding”,其实就是“氛围编程”。这功能让模型能根据现场气氛自动生成内容,比如玩游戏或者直播时,现场气氛一变,内容立马跟着变,用户感觉特别有参与感。 阿里云百炼已经把Qwen3.5-Omni的能力接到API上了,推出了Plus、Flash和Light这三个服务选项。不管你是做短视频还是开游戏公司,都能直接调用这个模型,给用户更好的体验。普通人想玩也没问题,直接去QwenChat平台就能免费体验一把。 至于价格这块更是划算,阿里云百炼给开发者的服务成本低到离谱。只要给模型输入一个Token(大概相当于一个字),花费才不到0.8元。这可比Gemini-3.1Pro便宜了不止十倍。这对企业来说省了不少钱,也让更多小公司能用上这先进的技术。 总之阿里这次放出的Qwen3.5-Omni绝对是一次重大突破。不光技术上让人服气,更让普通人也能感受到AI的厉害。以后随着这些全模态大模型越来越完善,咱们用起来肯定会越来越顺手。