deepseek的v4 模型最快下周到来

3月6日,吉颐给公众透露了一个重磅消息:DeepSeek的V4模型最快会在下周到来。一位直接接触相关计划的知情人士爆料说,这次要推出的可是一款全能选手,不光会生成图片、视频,还能处理文字。据当地时间2月28日《金融时报》的报道,DeepSeek计划在这周发布这个新模型。这个V4虽然还没正式官宣,但从媒体挖出来的情报看,它很可能就是那个被秘密测试的简化版V4 Lite。 这个Lite版本的代号叫“sealion-lite”,拥有100万个tokens的上下文窗口,比V3的128K高出了近8倍。理论上它能一次性读完一整部《三体》那么长的内容。它的架构是原生的多模态设计,意味着文字和图像理解是在训练初期就融合在一起的,不像以前那样只是事后拼接。据估算,这个Lite版的参数规模大概是2000亿。甚至有业内人士猜测,完整版的V4参数量可能会突破1万亿大关。 在实际效果上,Lite版明显比网页端或APP端的模型要强得多。有测试示例显示,它能用只有54行的极简代码画出Xbox手柄这种高质量的SVG图像。在代码优化和视觉还原度方面,V4 Lite甚至被认为比DeepSeek V3.2和Claude Opus 4.6还要出色。这说明它在空间推理和结构化输出能力上都有了显著进步。 为了让国产芯片更好地支持AI应用,DeepSeek还在硬件适配上下了功夫。他们专门为中国制造的芯片做了深度优化,希望能提振中国市场对国产半导体的需求。在发布V4的时候,DeepSeek还打算同步放出一份短的技术说明。大约一个月后,他们会再发布一份更详细的报告。 虽然目前DeepSeek还没有正式回应过任何消息,但从这些爆料来看,这款国产的AI大模型很可能会在中国市场掀起一股热潮。它不仅在技术上取得了突破,还能推动本土芯片的发展。