deepseek的v4 模型最快下周到来

3月6日，吉颐给公众透露了一个重磅消息：DeepSeek的V4模型最快会在下周到来。一位直接接触相关计划的知情人士爆料说，这次要推出的可是一款全能选手，不光会生成图片、视频，还能处理文字。据当地时间2月28日《金融时报》的报道，DeepSeek计划在这周发布这个新模型。这个V4虽然还没正式官宣，但从媒体挖出来的情报看，它很可能就是那个被秘密测试的简化版V4 Lite。这个Lite版本的代号叫“sealion-lite”，拥有100万个tokens的上下文窗口，比V3的128K高出了近8倍。理论上它能一次性读完一整部《三体》那么长的内容。它的架构是原生的多模态设计，意味着文字和图像理解是在训练初期就融合在一起的，不像以前那样只是事后拼接。据估算，这个Lite版的参数规模大概是2000亿。甚至有业内人士猜测，完整版的V4参数量可能会突破1万亿大关。在实际效果上，Lite版明显比网页端或APP端的模型要强得多。有测试示例显示，它能用只有54行的极简代码画出Xbox手柄这种高质量的SVG图像。在代码优化和视觉还原度方面，V4 Lite甚至被认为比DeepSeek V3.2和Claude Opus 4.6还要出色。这说明它在空间推理和结构化输出能力上都有了显著进步。为了让国产芯片更好地支持AI应用，DeepSeek还在硬件适配上下了功夫。他们专门为中国制造的芯片做了深度优化，希望能提振中国市场对国产半导体的需求。在发布V4的时候，DeepSeek还打算同步放出一份短的技术说明。大约一个月后，他们会再发布一份更详细的报告。虽然目前DeepSeek还没有正式回应过任何消息，但从这些爆料来看，这款国产的AI大模型很可能会在中国市场掀起一股热潮。它不仅在技术上取得了突破，还能推动本土芯片的发展。