谷歌gemini搞视频生成工具sora塞到chatgpt

话说呢，最近OpenAI可是有大动作，要把他们的视频生成工具Sora给塞到ChatGPT里面去。你想啊，现在谷歌那边也搞了个Gemini出来，搞得ChatGPT挺被动的，所以他们这次非得搞点大的不可。听内部人说，这事儿搞不好很快就能搞定，团队正在疯狂调试多模态的东西。其实呢，这主要是因为谷歌Gemini太能打了。他们用那个Veo AI技术搞视频生成，一下子就把ChatGPT的差异化优势给抢走了。现在ChatGPT的周活跃用户也就9.2亿左右吧，离去年定下的10亿目标还差那么8%呢。所以管理层觉得，赶紧把视频生成这块能力加上去，尤其是要吸引那些年轻人来玩。你看Sora这个家伙虽然是2024年2月刚出来预览，12月正式上线的，那会儿还上了苹果App Store免费榜的榜首呢。不过回头看看用户留存率实在是惨不忍睹。彭博社那边拿到的数据显示，现在它在应用商店里已经掉到第165位去了，主动分享生成视频的人更是少得可怜，连5%都不到。CEO萨姆·奥尔特曼也在内部会议上吐槽说，单纯做个独立应用根本没人粘住脚，必须得把它放到ChatGPT的流量池里去重新找找存在感。不过话说回来，把Sora塞进ChatGPT背后的压力也是大得惊人。你知道吗？视频生成的算力需求可是图像生成的30倍以上啊！这让我想起了2023年3月那事儿。当时ChatGPT搞了个宫崎骏风格写真生成功能，结果服务器直接过载了。短短48小时内处理了超过2.3亿次请求，直接把公司的计算资源消耗推高了470%。按照The Information的估算啊，到了2030年光是为了支撑这个新功能运行的AI推理成本就要突破2250亿美元了，这还没算上买硬件和烧电的钱呢。其实OpenAI这几年的战略调整也是挺反复的。就在半年前他们不是还想在ChatGPT里搞购物功能吗？结果刚搞了六个月就被叫停了。这种“快速试错、及时止损”的模式啊，恰恰说明了公司现在在维持技术领先和控制运营成本之间有多难搞。你得明白啊，现在ChatGPT早就不只是个聊天机器人了，它已经成了家居设计、服装定制等领域的大杀器了。行业观察家都说这是在深度拓展AI的应用场景呢。不过挑战也很明显啊！怎么在保证响应速度的前提下控制成本？怎么避免因为功能太多让用户体验变得乱糟糟的？这些都要靠技术团队的本事去解决了。谷歌、Meta这些公司也都在疯狂搞多模态AI呢，这场争夺用户注意力的仗算是彻底打起来了。