我那天中午刷手机,突然弹出个推送,标题写着“以色列总理内塔尼亚胡右手多出一根手指,AI替身疑云笼罩”。点开视频一看,画面上的内塔尼亚胡确实伸出了六根手指。网友们炸开了锅,各种猜测纷纷涌现,有人甚至怀疑是AI替身替换了他。不过事实证明,这其实是个视觉误导。我赶紧看了完整版视频,原来只是光线从窗户洒进来,把手掌折痕拉长了,静态截图下看起来就像多了一根手指。 权威媒体确认了这个消息,并没有什么AI替身。之前我记得DALL-E还有其他一些AI生成的图片也会有类似的错误,比如六指或者七指。现在虽然Stable Diffusion等技术进步了不少,但还是会出现这种问题。相比之下,现实中的光影效果更容易让人产生误解。想起我之前在实验室做过的一个项目,我们用手机摄像头测试了光线对人手的影响。结果发现,在低光环境下,手部折痕很容易被误认为是多余的手指。 当时有个工程师小李开玩笑说:“这比搞AI难多了,现实中的光影变化太随机了。”这话虽然是玩笑话,但也说明了一些问题。AI生成图像时依赖算法学习数据分布,手指数量的准确控制是个痛点。有时候数据训练得不够充分,就容易多出一根手指。不过这个过程也离不开强大的GPU算力支持,像NVIDIA这样的芯片供应商就提供了这种支持。粗略估算一下,一次大模型迭代可能要烧掉几百万美元的电费。 当时看到那个截图时我也信以为真了,赶紧转发给朋友群。结果有个朋友提醒我说:“哥们,你看看完整视频吧。”我觉得挺尴尬的,赶紧删掉了那条帖子。虽然这是个静态图片的误导问题,但是动态视频中的流畅度和光影变化让这一切显得自然很多。 现在回想起来,那个消息传播得非常快。从推送出来到大家纷纷转发也就没超过两个小时吧。虽然这只是一个小圈子里的现象,但速度确实让人惊讶。 随着AI技术的普及和发展,造假的门槛确实降低了很多。当年我们用一些手机App就能轻松制作deepfake视频了。现在政治人物的视频稍微有点异样就会引起大家的怀疑和猜测。 后来内塔尼亚胡亲自回应了这个问题,在一个街头咖啡馆拍了一段视频举着手说:“想数数我有几根手指吗?自己来看看吧。”那种带着点自嘲的语气一下子把谣言给辟谣了。 从产业链角度看,像硅谷这样的地方开发出来的AI工具很快就传到了中东地区。政治博弈激烈的时候,谁先掌握了deepfake技术谁就占优势。但实际上这些所谓的“AI替身”只不过是人们对光影错觉的误解而已。 再加上最近我翻看以前的照片时发现了类似的情况。上周拍的夕阳光下有一张照片里有个黑色阴影线当时没注意到其实是衣袖褶皱造成的结果呢。 这种谣言真的让人挺烦的每天刷屏浪费时间还让我产生了怀疑总觉得每张图片都是假的有时候甚至觉得自己快变成阴谋论者了。 那么你们平时看新闻的时候是怎么辨别真伪的呢?多看源头还是对比AI生成的手部图片? 像Midjourney以前生成的名人照手指弯曲很怪异现在虽然进步大了但是静态帧还是会露出马脚实际使用差异很明显现在像Sora这样的动态视频看起来很流畅但是一暂停就现原形真实视频光影变化自然流畅不会卡顿。 工程师老张跟我说过“AI替身?太科幻了吧光影是永恒bug人眼总上当”。 话题扯远一点说到芯片供应商比如台积电给AI提供硬件中东地区也购买这些设备普通用户用AI滤镜自拍手指没问题但政治级别的视频审查要求高多了延伸到日常生活中手机AR试衣手影干扰很多比如实验室里有一次小团队测试AR眼镜小美戴上挥手比划衣服突然喊道:“我的手多根了!”大家都笑场互动就那么一瞬60秒内搞定小美说:“这光线AI都救不了”真实互动半虚构但贴合经验数据点再讲一个Twitter上这个六指话题峰值互动超过50万范围估计不确定但从工具看类似事件年增30%比2019年deepfake视频热议高出一截个人体感辟谣帖转发率低谣言赢面大为什么情绪化恐惧AI操控放大焦虑后文留空白不展开情绪心理想起那咖啡馆画面内塔尼亚胡放下杯子阳光移位手影淡去正常五指一切回归平静但新问题冒头下次光影错觉会不会又生AI谣言拭目以待吧!