威尔·史密斯演唱会人山人海，AI却让真假难辨

一段威尔·史密斯演唱会视频在网络上引发了巨大争议，许多人指责其使用 AI 生成了虚假的观众。然而，事实更为复杂：视频中的观众是真实的，但画面经过了两层 AI 处理。首先，史密斯的团队使用 AI 技术将真实的观众照片转换成短视频片段；随后，YouTube 在其 Shorts 平台对视频应用了实验性的 AI 图像增强技术，这进一步加剧了画面的模糊和失真，最终导致其看起来像是伪造的。

看似伪造的 AI 观众

一段威尔·史密斯演唱会的视频片段在网上疯传，但原因并不光彩。人们普遍认为，视频中的观众是 AI 生成的，因为画面充满了典型的 AI 产物特征：

不自然的五官 和涂抹模糊的脸。
肢体（如手指）数量异常。
牌子上出现无法理解的文字。

这些视觉上的瑕疵让许多人相信，这是一场用技术伪造出来的“座无虚席”。

事实：观众是真实的

尽管视频看起来很糟糕，但其中的观众和场景都源于真实的素材。视频剪辑自威尔·史密斯近期欧洲巡演中多个场次的真实演出录像和照片。

主要演出画面：来自法国奥朗日的 Positiv Festival。
观众镜头：来自瑞士的 Gurtenfestival 和 Paléo 音乐节，以及比利时的 Ronquieres Festival 等。

通过对比官方发布的巡演照片，可以证实视频中那些看似“AI 生成”的观众其实是真人。例如，一个被 AI 扭曲成乱码的标语，在原始照片中清晰可见，上面写的是“From West Philly to West Swizzy”（Swizzy 是瑞士 Switzerland 的缩写）。

最有争议的一个例子是一对夫妇，他们举着标语感谢威尔·史密斯的音乐帮助他们战胜了癌症。如果这是 AI 生成的，将是一种极其恶劣的博取同情的手段。但事实是，这对夫妇是真实的，在威尔·史密斯的官方 Instagram 账号上可以找到他们的清晰照片。

两层 AI 处理揭秘

既然观众是真实的，那为什么视频看起来如此虚假？原因是视频经过了两个层级的 AI 处理。

第一层：史密斯团队的“图生视频”AI

史密斯的团队并没有从零开始生成虚假观众。他们的做法是：

使用真实照片：他们从巡演的官方摄影师那里获取了高质量的观众照片。
AI 动画处理：使用 Runway 或类似的“图像到视频”（image-to-video）AI 模型，将这些静态照片转换成短小的动态视频片段，以便用于演唱会混剪视频。

这种处理方式保留了真实的人物和场景，但生成视频的过程本身会引入一些 AI 特有的失真。

第二层：YouTube 的“秘密实验”

问题的关键在于 YouTube 的处理。史密斯的团队在 Instagram 和 Facebook 也上传了同样的视频，其画质明显优于 YouTube 版本。

YouTube Shorts 自动增强：近几个月，YouTube 一直在悄悄进行一项实验，即自动对其平台上的 Shorts 短视频进行图像增强处理。
技术原理：根据 YouTube 的说法，这项技术使用“传统的机器学习”来去模糊、去噪点和提升清晰度，但许多专家认为这与生成式 AI 中使用的扩散模型非常相似。
负面效果：这种强制性的后期处理往往会产生弄巧成拙的效果，使画面变得更加涂抹和不自然，进一步放大了第一层 AI 处理带来的瑕疵。

结论：一个复杂的真相

几乎所有的评论者都认为，威尔·史密斯团队伪造了粉丝来营造巡演火爆的假象。但真相远比这模糊和复杂。

人群是真实的，但视频经过了双重操纵：首先是史密斯团队为了制作动态效果而进行的 AI 动画处理，然后是 YouTube 在用户不知情的情况下施加的自动图像增强。

我们可以争论将真实照片用 AI 制作成视频的伦理问题，但这与大多数人所指责的——凭空捏造一个充满热情的粉丝群体——在性质上有着本质的区别。