英伟达260 亿美元开源ai大模型

英伟达今年3月12日向美国证监会(SEC)提交了一份文件,透露了他们未来五年计划在开源AI大模型上投下260亿美元的大手笔,这金额换算成人民币大约是1788亿元,比当年OpenAI给GPT-4花掉的30亿美元多得多。公司这次转型不光是要做芯片厂,更是要变成一个做全栈式AI的顶尖实验室。资金会分18到24个月投进去,预计到2026年底或者2027年初,首批自研的模型就能用了。技术路线上英伟达选了一条中间路:Open-weight。这种做法不像OpenAI那样彻底保密,也不像Meta的Llama那样完全开放。具体来说,英伟达会把模型里的关键参数(权重)公开出来,让企业和开发者随便下载拿去用,在自家设备或者私有云上运行、微调都行,这样能满足企业对隐私、定制和省钱的需求。不过训练数据和代码可能就不会全公开了。在具体的大模型研发上,英伟达准备多抓几个方向,比如语言、代码、科学计算、智能体这些都要搞。目前他们已经秘密做完了一个5500亿参数的超大模型预训练工作,这为后面的开源模型验证和测试打下了基础。