谷歌gemini搞视频生成工具sora塞到chatgpt

话说呢,最近OpenAI可是有大动作,要把他们的视频生成工具Sora给塞到ChatGPT里面去。你想啊,现在谷歌那边也搞了个Gemini出来,搞得ChatGPT挺被动的,所以他们这次非得搞点大的不可。听内部人说,这事儿搞不好很快就能搞定,团队正在疯狂调试多模态的东西。其实呢,这主要是因为谷歌Gemini太能打了。他们用那个Veo AI技术搞视频生成,一下子就把ChatGPT的差异化优势给抢走了。现在ChatGPT的周活跃用户也就9.2亿左右吧,离去年定下的10亿目标还差那么8%呢。所以管理层觉得,赶紧把视频生成这块能力加上去,尤其是要吸引那些年轻人来玩。 你看Sora这个家伙虽然是2024年2月刚出来预览,12月正式上线的,那会儿还上了苹果App Store免费榜的榜首呢。不过回头看看用户留存率实在是惨不忍睹。彭博社那边拿到的数据显示,现在它在应用商店里已经掉到第165位去了,主动分享生成视频的人更是少得可怜,连5%都不到。CEO萨姆·奥尔特曼也在内部会议上吐槽说,单纯做个独立应用根本没人粘住脚,必须得把它放到ChatGPT的流量池里去重新找找存在感。 不过话说回来,把Sora塞进ChatGPT背后的压力也是大得惊人。你知道吗?视频生成的算力需求可是图像生成的30倍以上啊!这让我想起了2023年3月那事儿。当时ChatGPT搞了个宫崎骏风格写真生成功能,结果服务器直接过载了。短短48小时内处理了超过2.3亿次请求,直接把公司的计算资源消耗推高了470%。按照The Information的估算啊,到了2030年光是为了支撑这个新功能运行的AI推理成本就要突破2250亿美元了,这还没算上买硬件和烧电的钱呢。 其实OpenAI这几年的战略调整也是挺反复的。就在半年前他们不是还想在ChatGPT里搞购物功能吗?结果刚搞了六个月就被叫停了。这种“快速试错、及时止损”的模式啊,恰恰说明了公司现在在维持技术领先和控制运营成本之间有多难搞。你得明白啊,现在ChatGPT早就不只是个聊天机器人了,它已经成了家居设计、服装定制等领域的大杀器了。行业观察家都说这是在深度拓展AI的应用场景呢。 不过挑战也很明显啊!怎么在保证响应速度的前提下控制成本?怎么避免因为功能太多让用户体验变得乱糟糟的?这些都要靠技术团队的本事去解决了。谷歌、Meta这些公司也都在疯狂搞多模态AI呢,这场争夺用户注意力的仗算是彻底打起来了。