2024年印度AI市场给大家展示了一个低功耗、深耦合的典型样板。这个样板告诉我们,不一定要依靠烧钱或者堆硬件才能发展。比如,Ashwini Vaishnaw就把目标定为首期部署1万块GPU,给开发者、研究者等提供使用。到了2025年,印度就已经部署超过34,333块GPU,并且通过云服务商给大家提供服务。其中,Sarvam AI直接寄生在WhatsApp里,不强迫用户下载新的App,而是通过语音优先,让印度人用语音就能查询政府补贴和处理银行KYC认证。另一家Krutrim AI则由Ola创始人成立,它不仅是聊天机器人,还被嵌入到Ola的打车软件、外卖系统甚至电动摩托车仪表盘里。这个2026年也初显成效了。 Sarvam和Krutrim都通过自研分词器降低成本70%,让他们在印度这种对价格极度敏感的市场得以普及。每小时65卢比(约合人民币6元)的使用价格让草根程序员都能用得起算力。 这样的AI部署不仅限于普通用户,Krutrim还研发了印度自主的AI芯片。这种全栈式路径虽然在技术上限上还难望通义千问之项背,但在场景落地和代执行能力上已经成为了印度白领生活基础设施。 Sarvam专注于语音优先和多语言交互功能,能听懂带有浓重乡音的方言语音。Kruthim则与Ola打车软件结合起来。普通LLM在处理印度多种语言时非常消耗Token,成本高昂。而Sarvam和Kruthim通过自研分词器把成本降低了70%,让它们在价格敏感市场得以普及。 这个过程中虽然没有参与补贴大战,但他们也没参与前沿大型模型军备竞赛。他们把目光放在了包容性强、应用导向的AI部署上。这样就能够让那些甚至不会写字的底层民众也能通过最廉价方式享受到AI带来的数字红利。 虽然政府补贴、算力底座薄弱还有人才外流等问题依然存在,但他们确实为AI发展提供了一个低功耗、深耦合的样板。 Sarvam AI是住在WhatsApp里的元宝一样让中国开发者眼红;Kruthim:印度版的千问。 阿里通义和腾讯元宝开启狂撒金币模式;左手邀好友领红包右手拉新即提现。左手一个高参数高大上右手一个拉新红包模式硬生生把AI助手做成了拼多多。这些模式背后是强大算力储备和成熟C端生态。 硅谷OpenAI和谷歌卷得眼睛都红了;一边忙着发钱求你用我一边忙着烧钱求你给我卡。喜马拉雅山对面兄弟却淡定得很没掺和神仙打架而是摸索出低配版逆袭之路。不烧钱不堆卡主打性价比极高平替路线直接把AI卷出了新高度。 中国内地互联网用户对红包大战不陌生从豆包到元宝各大厂重金补贴争夺用户这种模式背后是强大算力储备和成熟C端生态然而印度国情决定无法复刻这种壕无人性路径缺乏尖端芯片电网基建不稳且人均付费意愿极低但正如印度IT外包曾靠低成本高效率占领全球一样印度在AI浪潮中展现惊人韧性不求最强脑力但求最懂本地。 硅谷还在纠结AGI尽头是不是核聚变;而我们大厂已经想通了AI尽头是拉新是红包是下沉市场。