问题——在数字内容需求快速增长的背景下,视频已成为信息传播与消费的核心载体,但传统视频制作与生成普遍面临“周期长、成本高、迭代慢”的瓶颈。
尤其在生成式技术快速发展的当下,如何在保证画面清晰度与一致性的同时,实现更低延迟、更强交互,成为产业关注的关键课题。
原因——业内人士指出,过去视频生成多以“离线渲染式”路径为主:系统根据指令一次性生成完整片段,用户往往需要等待较长时间才能看到结果;一旦需求变化,常常需要重新生成,导致效率与体验受限。
本次论坛期间亮相的PixVerse R1尝试以“实时交互”为目标重构技术链路:在同一生成体系中统一处理文本、图像、音频与视频等多类输入,利用流式生成机制维持画面连续,并通过压缩计算步骤的响应引擎,将生成延迟由“分钟级”压缩至“秒级”。
据介绍,该模型可支持最高1080P分辨率的通用实时生成,并在生成过程中持续接收新指令,使画面随指令自然演化,而非中断后重来。
影响——“秒级响应”的变化,带来的不仅是速度提升,更是内容形态的转变:视频从“生成完再观看”的结果,逐步走向“边生成边调整”的过程。
在论坛互动体验中,奥的斯全球公司董事长、首席执行官兼总裁朱蒂提出想看熊猫,系统随即生成“大熊猫乘船远行”等画面,引发现场嘉宾围观与讨论。
昆山杜克大学美方校长约翰·奎尔奇体验后表示,此类工具有助于提升工作与生活效率,体现了有效的技术创新。
多位与会人士认为,当画面可随想法即时变化,创意表达门槛将被进一步降低,跨语言、跨场景沟通也可能因此更直观。
对策——推动实时生成能力从展示走向落地,仍需在规范与生态上同步发力。
一方面,要夯实核心技术指标,持续提升生成的稳定性、一致性与可控性,降低复杂场景下的失真与偏差,建立更可靠的评测体系。
另一方面,面向产业应用需强化合规治理与版权保护,完善内容标识、数据来源管理与安全审查机制,促进技术在可用、可控、可追溯的轨道上发展。
同时,应鼓励与影视制作、游戏引擎、教育平台、文旅场馆等行业伙伴开展协同创新,形成从模型能力到工具链、再到应用场景的完整闭环,避免“有模型、缺流程、难规模”的落地困境。
前景——作为中国高水平对外开放的重要对话平台,中国发展高层论坛持续释放“以开放促创新、以合作促共赢”的积极信号。
实时世界模型的出现,折射出新一轮内容生产方式的加速演进:在游戏领域,可用于动态生成可探索世界;在影视领域,可支持镜头与场景的即时试拍与调整;在教育与科普领域,可将抽象知识转化为可互动的可视化过程;在文旅领域,也有望用于沉浸式导览与数字展陈。
业内预计,随着算力效率提升、工具链完善与产业协同加深,实时生成将从“展示性创新”走向“生产性能力”,成为数字经济中具有广泛外溢效应的新型基础设施之一。
从论坛现场的“秒级生成”到产业端的“规模应用”,技术突破只是起点。
如何在效率跃升的同时守住安全底线、在降低门槛的同时完善规则体系、在开放合作中形成可持续的创新生态,将决定实时生成技术能走多远、用得多好。
把创新力转化为生产力,把新技术转化为新价值,关键在于以更高质量的治理与更有序的应用,推动科技进步更好服务经济社会发展。