谷歌刚把Gemini 3.1 Flash-Lite给咱们送来了,据说这是该系列里最快、最划算的家伙。现在你能用Google AI Studio里的API来抢先体验,企业用户也能在Vertex AI平台上试试水。大家最关心的钱袋子问题也解决了,谷歌这回定价挺狠:每百万输入Token只要0.25美元,输出也才1.5美元,这价格谁能不爱? 在性能上这块,Gemini 3.1 Flash-Lite算是立住了脚。有个叫Artificial Analysis的平台测了下数据,新模型的首字响应时间(TTFT)直接暴涨了2.5倍,整体速度也提升了45%。这种快得像闪电的感觉特别适合做那些需要实时响应的活儿。 在各个实战测试里,这个模型也挺争气。它在Arena.ai的排行榜上拿了1432分的Elo分,还在多模态理解和逻辑推理上干掉了不少对手。具体来说,它在GPQA Diamond测试里正确率高达86.9%,MMMU Pro测试里也有76.8%的表现。就连那个体型更大的上一代Gemini 2.5 Flash也没能挡住它。 IT之家把这组数据给大伙儿列出来了。除了硬件性能强,它还给AI Studio和Vertex AI标配了个“思考层级”功能。这招太实用了,能让开发者根据任务难度来灵活调整模型的思考深度。做翻译或者审核这类性价比任务的时候调低层级就行;要是做界面生成或者逻辑模拟这种难活,就把层级调高,让模型使劲想。 Latitude、Cartwheel和Whering这些搞前沿测试的企业已经先下手为强了,在复杂的业务场景里用上了这个模型。反馈都说好,说它不仅干活快、能推导出逻辑关系,处理复杂指令时的精准度也跟大型模型差不多。