telestudio的ai 视频创作大赛

嘿,给大家报个喜,咱们中国电信的多模态视频生成大模型可是挤进全球前五了,在自家国内参评的型号里更是稳稳排在前三。这事儿是2024年12月那次的Artificial Analysis公布的榜单里说的,专门评的是“图像生成视频领导者榜”(Image to Video Leaderboard)。 这个能拿名次的TeleVideo 2.0,是中国电信人工智能研究院(TeleAI)跟中电信人工智能科技有限公司联手搞出来的。说白了就是TeleAI和旗下那家公司一块儿攻关的星辰大模型体系里的一个分支,这套体系是首席科学家李学龙教授带的队伍整出来的。咱们中国电信在人工智能这块研究时间挺长,搞工程实践也一直没停,所以这模型才能这么厉害。 别看它在全球排名靠前,人家实打实做了不少工作。视频生成质量好不好,很大程度上要看用来训练的数据集怎么样。为了这点,TeleAI专门搭了一套叫“筛选-清洗-均衡-适配”的数据治理流水线。这个流水线就像一个严格的质检员,给每一张图片、每一帧视频都过了一遍筛子,保证最后拿来训练的素材都达标。有了高质量的数据打底,模型才能既还原物理世界又能搞艺术创作。 以前的视频模型老有画面闪烁、物体变形、动作跳帧的问题,TeleVideo 2.0把这些都给解决了。研发团队设计了个“全局规划与局部精修”的新架构,从大的方面规划物体咋运动,小的方面琢磨每帧细节咋处理。这一招下来,物体动起来特别丝滑,画面看着也稳当。 不光架构新,训练方法上也有长进。他们搞出了一套统一的视频后训练框架,把原来那种靠专家瞎捉摸的参数调试变成了一个可以诊断、能解释、还能一直改的系统工程。这套方法能让长视频、高分辨率视频生成得更好更可控。 当然了,要让这么个大家伙跑起来得靠算力支撑。TeleVideo 2.0是跑在TeleAI自己研发的TeleTron视频生成训练框架上的。这是他们自己的算力底座,提供了强劲的动力,还保障了技术链条安全、迭代快。 光有技术还不行得用来干活。基于这个大模型,TeleAI推出了个叫“TeleStudio”的AI视频创作平台。这个平台是咱央企头一个能覆盖“文生图、文生视频、图生视频、角色驱动”全流程的工具。这下可好了,专业级的视频创作门槛一下子降下来了。 为了鼓励大家玩创新,他们还搞了个基于TeleStudio的视频创作大赛征集作品呢。中国电信这次能在国际评测里拿高分,真是咱们在AI前沿领域坚持自主创新的又一个好例子。从底层的数据到训练的方法,再到算力的框架全都是咱们自己搞定的。 这套技术也不光是在实验室里摆着好看。随着TeleStudio这种平台落地和普及,这项突破很快就能从实验室跑到市场上去。未来这肯定能重塑视频生产的方式,给数字文化的繁荣和发展新质生产力提供强大的技术底座和创新引擎。