咱们都知道,TikTok上有个特别牛的功能,叫AI绿幕。就是你随便发个视频,给它5秒时间,它就能给你整出个独一无二的背景。这玩意儿不像以前那样老是千篇一律的白墙,它直接把关键词变成画,蓝天、霓虹、人脸、建筑都有。运气好的话,画面和内容还能撞出火花。 咱们来试试这玩意儿灵不灵。把“Facebook”“苹果”“马云”“马斯克”这些词扔进去。输入“Facebook”,出来的画面是蓝的,中间飘着一只独眼和半截耳朵,看着怪吓人的。要是输“苹果”,能出来一个红富士;“中国”就变成青砖灰瓦的房子。但要画苹果公司的logo或者库克,系统直接给了个厨房乱炖图,看来品牌关键词得输准了。 还有像“阿里巴巴”“腾讯”“字节跳动”,画出来的既像又不像,特别抽象。输“李子柒”的话,就是一片治愈系的稻田;“温格”变成了赛场剪影;“马云”那个画面还是有点惊悚;“马斯克”更绝了,一连生成四张都认不出来。 再说说别的词。“Switch”就直接带塞尔达风;“广州”则是小蛮腰和霓虹灯。 为什么这么快?主要是TikTok走了个捷径。生成写实照片太费算力,TikTok就画印象派、抽象派的速写。相似度不够氛围补一补,用户看着也舒服。 这跟Google的Imagen比起来有啥区别?Google的预设模板都在官网放着,得输入好多字才出图;TikTok直接把按钮放在发布页,随手指一按就搞定。 OpenAI的Dall-E虽然也能编辑图片、自动补阴影纹理,厉害得很,但现在还在封闭测试里。内测用户每月才送15分积分,一分换四张图;想用就得买积分或者找商用途径。好在生成的图能随便用。 Deepfake之前闹出的事大家都知道吧?输入点带坏主意的词可能会画暴力或露肉的东西。TikTok用抽象画风加审核双重保险;Dall-E则是在算法层面屏蔽暴力词还搞人工巡查。 以后要是技术成熟了,写文章后面写着“题图由Dall-E生成”就不稀奇了。到时候咱们只管想灵感,不用再熬夜找图了。