最近苹果公司在AI领域又有新动作了,他们推出了LiTo模型,说是能把一张普通的照片瞬间变成3D的效果,细节还很逼真。以前大家觉得做3D重建特别难,这次苹果给了我们一个惊喜。LiTo模型最大的特点就是只需要一张平面图片,就能还原出完整的3D物体,连光影质感都做得很到位。以前的模型遇到的问题是当你转动视角时,光影往往会变形或者失真。但LiTo通过引入一种叫做Latent Space的新技术解决了这个问题。它不再是死记硬背像素,而是用数学方法掌握了光线和物体表面交互的规律。 简单来说,LiTo的“脑补”能力很强。就算只有一张正面照,它也能精确预测出物体背面在不同光照下的镜面高光和菲涅尔反射。官方公布的测试结果显示,LiTo在多视角光影还原上已经超过了行业领先的TRELLIS模型。为了让这个AI模型变得更精准,研究人员用了150个视角和三种光照条件来训练它。这次苹果对光影追求得特别认真,显然是为了Vision Pro这类空间计算设备做准备。 你想一下未来如果你用iPhone拍一张照片,LiTo就能把它变成一个栩栩如生的3D模型,然后直接放进Vision Pro里的虚拟空间里。这种从2D到3D的极简转换方式,也许正是苹果在AI赛道上实现“后发制人”的关键手段。 总之这个LiTo模型给人的感觉挺厉害的。你只需要一张普通照片就能得到一个物理级真实度的3D模型,在这方面Vision Pro就变成了它最好的合作伙伴。