英伟达260 亿美元开源ai大模型

英伟达今年3月12日向美国证监会（SEC）提交了一份文件，透露了他们未来五年计划在开源AI大模型上投下260亿美元的大手笔，这金额换算成人民币大约是1788亿元，比当年OpenAI给GPT-4花掉的30亿美元多得多。公司这次转型不光是要做芯片厂，更是要变成一个做全栈式AI的顶尖实验室。资金会分18到24个月投进去，预计到2026年底或者2027年初，首批自研的模型就能用了。技术路线上英伟达选了一条中间路：Open-weight。这种做法不像OpenAI那样彻底保密，也不像Meta的Llama那样完全开放。具体来说，英伟达会把模型里的关键参数（权重）公开出来，让企业和开发者随便下载拿去用，在自家设备或者私有云上运行、微调都行，这样能满足企业对隐私、定制和省钱的需求。不过训练数据和代码可能就不会全公开了。在具体的大模型研发上，英伟达准备多抓几个方向，比如语言、代码、科学计算、智能体这些都要搞。目前他们已经秘密做完了一个5500亿参数的超大模型预训练工作，这为后面的开源模型验证和测试打下了基础。