豆包大模型这次终于升级到了2.0版,正式拉开了Agent时代的序幕。这个版本专门围绕咱们实际使用的需求做了改进,把推理速度提上去了,多模态理解能力也加强了,还能应付更复杂的指令。这回推出的豆包2.0系列有三款通用Agent模型,还有一个专门的Code模型。其中,豆包2.0 Pro是为了搞深度推理和长链路任务准备的,实力跟GPT 5.2和Gemini 3 Pro不相上下;Lite版本兼顾性能和成本,比老款豆包1.8强多了;Mini是为了那些对低时延、高并发还有成本特别敏感的场景设计的;Code版是专为写代码用的。现在豆包2.0 Pro已经在手机App、电脑端还有网页上都能看到了,你直接选个“专家”模式就能跟它聊。Code版还接入了AI编程产品TRAE。火山引擎那边也给企业和开发者准备好了API服务。 豆包2.0在多模态理解这块儿可是下了大功夫,在各种看图片的任务上都达到了世界顶尖水平。像视觉推理、空间理解还有能读懂长文章这些方面,它的表现特别亮眼。Pro版在不少测试里都拿了最高分。为了更好地应对动态场景,豆包2.0强化了对时间序列和运动变化的感知能力,在TVBench这种测评里领先不少。最有意思的是在EgoTempo这个基准测试上它居然超过了人类的分数,说明它捕捉“变化、动作、节奏”这种信息更稳当,干活也更靠谱。看长视频的时候它也表现出色,好多流式问答测试它都赢了。这让它能做个好助手,实时帮你分析视频、感知环境、主动纠错甚至陪着你聊天。以后健身或者挑衣服什么的都能让它帮着看。 LLM和Agent的表现也有了大提升。处理长程任务需要知道很多真实世界的知识。通过补充长尾领域的知识,豆包2.0 Pro在SuperGPQA上的分数超过了GPT 5.2,在HealthBench上拿了第一,科学成绩跟Gemini 3 Pro和GPT 5.2差不多。数学竞赛方面也很厉害,IMO、CMO和ICPC编程竞赛都拿到了金牌成绩,连Putnam Bench上也比Gemini 3 Pro强。在HLE-text这个号称“人类最后考试”的项目上它得了54.2分最高分。这次豆包2.0还降低了推理成本。虽然效果跟顶尖大模型一样好,但token价格降了快一个数量级。做复杂任务的时候要花很多token钱这时候成本优势就很关键了。 基于OpenClaw框架和豆包2.0 Pro模型,我们在飞书上搞了个智能客服Agent。它能帮着接待客户对话,遇到难题还会拉群找真人帮忙预约维修员修完回访顺便推销产品。Code模型能提高开发效率快速搭建复杂应用。它在解读代码库和生成应用方面都有所加强还能纠错。这个模型已经被TRAE中国版用起来了支持看图和推理。 比如说开发一个“TRAE春节小镇 · 马年庙会”的互动项目这事儿吧。这场景挺复杂的但只要用TRAE加豆包2.0 Code只要1轮提示词就能搭出基本框架调几次后总共5轮就搞定了。有11个性格不同的NPC由大模型驱动自然聊天招呼客人砍价AI游客自己决定逛哪家买什么说什么烟花祝福和孔明灯题词都是AI实时生成的每进小镇看到的互动都可能不一样。