2023年初,DeepSeek R1推出,凭借557万美元的训练成本,在数学推理上的准确率比GPT-4o高出2.3个百分点。这使得DeepSeek在GitHub上的关注度急剧上升,短短三天内就获得了超过10万个星标。连国外工程师都在凌晨三点发帖表示,他们用A100运行推理代码时,发现DeepSeek的速度比Llama-3还要快。梁文峰在浙大校友群里发了一张照片,显示他的办公室白板上写满了公式,右下角画着一个火箭,旁边写着“不堆卡,不烧钱,就做难而对的事”。 那个时候,DeepSeek的API调用量一直在上升,甚至超过了GPT-4o。不过最近情况有所变化。DeepSeek在Poe平台上的API调用排行中表现平平,Kimi K2.5的曲线一直往上走,而DeepSeek的曲线几乎是平的。到了2025年3月15日,Artificial Analysis进行了横向测评,发现DeepSeek的V3.2在长文本处理、代码补全和中文逻辑推理等方面都输给了智谱GLM-5和MiniMax M2.5。就连参数量只有其一半的阶跃星辰Step-3.5 Flash都跑在它前面。 数据显示,从去年2月到5月的四个月时间里,DeepSeek的官网流量下降了29%。API调用量也从42%一路跌到了16%。OpenClaw“龙虾”爆火的那个星期,开发者疯狂调用Kimi、Moonshot和Step-3.5的API,结果DeepSeek的调用量反而环比下跌了11%。 腾讯元宝团队原计划等到V4上线后就做多模态兼容测试,但初四还在调试fallback逻辑。幻方量化的老员工私下透露说,2023年那会儿杭州滨江的机房半夜三点还亮着蓝光,但现在晚上九点的时候,运维监控屏上的GPU使用率常年卡在37%。SemiAnalysis去年发布的三份报告显示出这个趋势:从2月到5月,Token调用量从42%一路滑到16%。 DeepSeek在苹果商店上的排名也从之前的效率榜TOP3掉到了第36名。用户们对更新日志表示不满,有人甚至说自己连“已知问题”是什么都不知道。现在如果点开苹果商店搜索“DeepSeek”,最新一条用户反馈是:“更新日志还是‘修复若干已知问题’,可我连‘已知问题’是啥都不知道。” 时间过得真快啊。445天——从DeepSeek-V3发布那天算起,刚好一年零两个多月过去了。这期间,梁文峰没有发过一次正式发布会,也没有上线过一个全新主干模型,连微博也只转发过三篇技术论文。之前他发过一张办公室白板的照片,现在白板已经擦干净了。 云计算和AI技术发展迅速,OpenAI的H100集群规模是DeepSeek能调用高端芯片的十倍不止。但更真实的困境藏在细节里:2月上线的百万上下文测试版,情感记忆模块至今没迁完;多模态V4原定3月上线,结果腾讯混元那边都放出姚顺雨团队的Demo视频了。 DeepSeek微博还挂着V3.2的文档更新日志。上周我试了试他们最新版App,输入“帮我写封辞职信”,它真写了——但署名是“DeepSeek AI Team”,不是“张三”。 之前DeepSeek凭借开源和廉价API赢得了用户的好感,评论区里全是“开源真香”、“API便宜到不敢用”。现在呢?第36名。这次DeepSeek-V4成功击败GPT-4o后却销声匿迹了。 最近我在深圳南山区一家咖啡馆改稿时发现隔壁桌两个年轻人在手机上看Poe平台的API调用排行:Kimi K2.5那条线蹭蹭往上窜,DeepSeek那条线几乎趴在底部喘气。我低头看了眼微信收藏夹里去年2月截的图:DeepSeek App下载量破亿,App Store效率榜TOP3。 有时候你盯着一个App图标,心里想的不是它能做什么,而是:它还在吗?