这玩意儿牛得很,总参数达到了3970亿。但咱看看它激活的参数量,居然才170亿,显存占用直接

大家过年好,今天大年三十,咱们国产科技公司又整出大动作。阿里这家伙直接在除夕当天开源了个叫千问Qwen3.5-Plus的新模型,这玩意儿牛得很,总参数达到了3970亿。但咱看看它激活的参数量,居然才170亿,显存占用直接降了60%,既省成本又跑得飞快。在跟Gemini3 Pro这种巨头的硬刚中,这个千问3.5在不少权威测试里都拿了个第一名,API调用的价格更是低到了每百万字符只要0.8元,这价格跟Gemini3 Pro比起来那简直就是天壤之别。最厉害的是,它不仅能说话还能看图,这种原生多模态的本事可不是随便哪家都有的。 不仅如此,智谱也宣布上线了自家的GLM-5,说是“Agentic Engineering时代最好的开源模型”。科大讯飞和MiniMax也没闲着,一个推出了国产算力训练的星火X2大模型,另一个是M2.5模型,处理起复杂任务来都相当老练。字节跳动那边也不甘示弱,新的视频生成模型Seedance2.0刚一出来就火遍了全球。 这其实也不是咱们中国科技公司第一次挑着春节放假的时候搞事情了。2025年的春节前也是这样的场景,当时阿里云通义团队推出了Qwen2.5-Max,DeepSeek更是迎来了大量新平台的接入上架。上海财经大学的胡延平教授就觉得这次大家发的新模型都特别实用。它们都带了多模态和智能体能力,代码也好、多语言也罢表现都很均衡,就连空间智能和视觉推理也都能搞定。同样的智能水准只要以前三分之一的体量就能达到,解码的速度更是翻了好几倍。 专家们说,Qwen3.5的意义可不只是单纯地刷新榜单那么简单。过去两年行业里全是“大力出奇迹”,参数堆到了万亿级别性能是强了不少,但代价也水涨船高。中小企业根本用不起专用的推理集群烧钱的玩法。Qwen3.5的路子就不一样了,它的目标是比谁更聪明,用更小的模型来换取更大的智能。 它不仅能“看懂”图片进行像素级定位和代码处理,还能理解两小时视频里的因果关系。更绝的是能把一张手绘草图变成能运行的前端代码,甚至能像个智能体一样自己动手操作手机电脑去跨应用完成复杂任务。这一通操作下来就为后续的多模态生成和推理打下了基础。 中国工程院的倪光南院士也提到开源现在是全球IT发展的一股强大力量。在大模型引领的AI领域里中国表现得特别强劲,Qwen、DeepSeek、Kimi这些模型都在国外的LMArena排行榜上名列前茅呢!