最近,小红书把它的图像编辑新模型FireRed-Image-Edit 1.1给开源出来了,这个版本让咱们用起来感觉不一样。小红书说,他们在这次升级里,把好几个核心的能力给优化得特别到位。 你有没有遇到过这种情况,想改改图片里的人物造型,结果到最后连人都认不出来了?这次FireRed-Image-Edit 1.1可是专门解决这个痛点的。它用了更牛的注意力机制,把人物的特征给牢牢抓住了。不管是换发型还是换背景,系统都能精准地记住原来的模样。测试发现,连续做10次操作后,识别准头比以前提高了37%,彻底解决了那种“面目全非”的尴尬。 这个版本还特别厉害,在一张图里能合并超过15个不同的东西。以前那些乱七八糟的遮挡问题,现在全靠优化后的自动裁剪算法和智能拼接技术搞定了。有一回做建筑场景的测试,古建筑、现代建筑和自然景观被完美地合在了一起,专业的评审团看完都觉得非常自然流畅。 美妆这块也有了大进步,研发团队又加了23种专业的妆容模板,不管是影视特效妆还是日常裸妆都能搞定。最妙的是肤色自适应系统,它能根据图片原来的光照条件自动调整妆的浓淡,这样就不会有那种看上去很假的“浮粉”或“假白”效果了。 文字排版也是这次升级的重头戏。新的排版引擎让模型能完全听懂用户输入的字体风格指令。在海报设计测试里,它生成的字和专业设计师的作品在视觉舒适度上居然达到了91%的相似度。 技术层面也做了不少改进。他们开放了完整的LoRA训练框架,大家可以快速定制自己想要的风格。还有专门的推理优化方案,用蒸馏技术把参数精简了40%。搭配上量化处理和静态编译技术,单张NVIDIA A100显卡的生成速度缩短到了5秒左右,显存占用也降到了28GB。 对于那些要合成多张图片的复杂任务,新增的Agent智能调度系统就能派上用场了。当检测到素材超过3张时,它会自动分析每一张的有效区域,通过动态拼接生成指令。这么一来,多图合成任务的成功率就从68%提升到了89%。 总之,小红书这次推出的FireRed-Image-Edit 1.1模型真是让人眼前一亮!不论是专业设计师还是普通用户,都能找到自己想要的功能。