一段威尔·史密斯演唱会视频在网络上引发了巨大争议,许多人指责其使用 AI 生成了虚假的观众。然而,事实更为复杂:视频中的观众是真实的,但画面经过了两层 AI 处理。首先,史密斯的团队使用 AI 技术将真实的观众照片转换成短视频片段;随后,YouTube 在其 Shorts 平台对视频应用了实验性的 AI 图像增强技术,这进一步加剧了画面的模糊和失真,最终导致其看起来像是伪造的。
看似伪造的 AI 观众
一段威尔·史密斯演唱会的视频片段在网上疯传,但原因并不光彩。人们普遍认为,视频中的观众是 AI 生成的,因为画面充满了典型的 AI 产物特征:
- 不自然的五官 和涂抹模糊的脸。
- 肢体(如手指)数量异常。
- 牌子上出现无法理解的文字。
这些视觉上的瑕疵让许多人相信,这是一场用技术伪造出来的“座无虚席”。
事实:观众是真实的
尽管视频看起来很糟糕,但其中的观众和场景都源于真实的素材。视频剪辑自威尔·史密斯近期欧洲巡演中多个场次的真实演出录像和照片。
- 主要演出画面:来自法国奥朗日的 Positiv Festival。
- 观众镜头:来自瑞士的 Gurtenfestival 和 Paléo 音乐节,以及比利时的 Ronquieres Festival 等。
通过对比官方发布的巡演照片,可以证实视频中那些看似“AI 生成”的观众其实是真人。例如,一个被 AI 扭曲成乱码的标语,在原始照片中清晰可见,上面写的是“From West Philly to West Swizzy”(Swizzy 是瑞士 Switzerland 的缩写)。
最有争议的一个例子是一对夫妇,他们举着标语感谢威尔·史密斯的音乐帮助他们战胜了癌症。如果这是 AI 生成的,将是一种极其恶劣的博取同情的手段。但事实是,这对夫妇是真实的,在威尔·史密斯的官方 Instagram 账号上可以找到他们的清晰照片。
两层 AI 处理揭秘
既然观众是真实的,那为什么视频看起来如此虚假?原因是视频经过了两个层级的 AI 处理。
第一层:史密斯团队的“图生视频”AI
史密斯的团队并没有从零开始生成虚假观众。他们的做法是:
- 使用真实照片:他们从巡演的官方摄影师那里获取了高质量的观众照片。
- AI 动画处理:使用 Runway 或类似的“图像到视频”(image-to-video)AI 模型,将这些静态照片转换成短小的动态视频片段,以便用于演唱会混剪视频。
这种处理方式保留了真实的人物和场景,但生成视频的过程本身会引入一些 AI 特有的失真。
第二层:YouTube 的“秘密实验”
问题的关键在于 YouTube 的处理。史密斯的团队在 Instagram 和 Facebook 也上传了同样的视频,其画质明显优于 YouTube 版本。
- YouTube Shorts 自动增强:近几个月,YouTube 一直在悄悄进行一项实验,即自动对其平台上的 Shorts 短视频进行图像增强处理。
- 技术原理:根据 YouTube 的说法,这项技术使用“传统的机器学习”来去模糊、去噪点和提升清晰度,但许多专家认为这与生成式 AI 中使用的扩散模型非常相似。
- 负面效果:这种强制性的后期处理往往会产生弄巧成拙的效果,使画面变得更加涂抹和不自然,进一步放大了第一层 AI 处理带来的瑕疵。
结论:一个复杂的真相
几乎所有的评论者都认为,威尔·史密斯团队伪造了粉丝来营造巡演火爆的假象。但真相远比这模糊和复杂。
人群是真实的,但视频经过了双重操纵:首先是史密斯团队为了制作动态效果而进行的 AI 动画处理,然后是 YouTube 在用户不知情的情况下施加的自动图像增强。
我们可以争论将真实照片用 AI 制作成视频的伦理问题,但这与大多数人所指责的——凭空捏造一个充满热情的粉丝群体——在性质上有着本质的区别。