soulx-flashhead 开源单卡4090 推理帧率96fps

SoulX-FlashHead模型正式把实时数字人推到了新高度。这次开源的项目不仅解决了“小模型没好画质”的老大难问题,还在单卡RTX 4090上实现了高达96FPS的流畅推理。通过双向蒸馏技术,AI给模型装上了校准器,让人物特征始终稳定如初。这个过程里,Ground Truth作为先知锚点进行了强约束。模型总共参数1.3B,并且在10000多小时的训练素材中精炼出了782小时的高质量音画数据。这些数据经过DWpose关键点、唇形一致分数过滤等步骤处理,最终为AI提供了纯净的“养料”。 SoulX-FlashHead把推理速度和画面质量兼顾得很好。Lite版本让单卡4090推理帧率达到96FPS,只需要6.4G显存就足够了,还能支持3路并发。Pro版本则在RTX 5090上跑出16.8FPS,双卡配置能跑到25FPS以上。它在FID和Lip-sync这两个核心指标上都达到了SOTA水平。这项技术给直播、NPC、外教这些场景带来了很大便利。 这个开源项目包含论文、项目主页、代码和模型下载地址。用户可以直接去Soul-AILab的GitHub仓库获取详细信息。IT之家也附上了完整的下载链接:论文地址、项目主页、GitHub仓库地址、HuggingFace模型地址和数据集地址。通过这个模型,用户可以轻松实现7x24h的矩阵直播、游戏NPC引擎以及AI一对一外教服务。