任何人都可以让弗拉基米尔·普京微笑

经过:朱莉娅·莱顿(Julia Layton)

这个最新版本的面部运动捕获是否意味着我们不能再信任在线视频?不必要。但这很快。Face2face YouTube视频的屏幕截图“width=
这个最新版本的面部运动捕获是否意味着我们不能再信任在线视频?不必要。但这很快。Face2face YouTube视频的屏幕截图

显然,让弗拉基米尔·普京(Vladimir Putin)的微笑所需要的只是其他人微笑,网络摄像头和良好的图形硬件。

埃尔兰根·纳伦堡大学的计算机科学家,马克斯·普朗克信息学研究所和斯坦福大学的计算机科学家已经开发了方法面部运动捕获可以实现团队所谓的“影子主义”结果,使用我们大多数人在家中拥有的设备。它是实时完成的。

有些人称其为在线视频的死亡之后是证据。其他人印象深刻:演示视频对于该系统,称为face2face,非常出色。

在2016年3月的帖子中,研究人员展示了他们的软件可以使用现场直播的“演员”(通常是斯托克俄罗斯总统的网络摄像头和YouTube镜头)来做什么。当演员在网络摄像头前经历一系列面部表情时,每个表达式同时出现在视频中的普京的脸上。当演员做出鱼状的嘴巴动作时,普京会做出类似鱼类的嘴巴运动。当演员突然微笑时,普京也这样做。一切看起来都是真实的。

广告

运动捕获和重新制定

运动捕获或MOCAP本质上是将活人的动作转换为计算机数据,然后将该数据应用于其他数字化形式的过程。该技术具有各种应用,包括运动训练和医学,但它可能以电影作品而闻名。

就像在“指环王”中对Gollum进行动画动画的动作捕获系统,并为Benjamin按钮提供了布拉德·皮特(Brad Pitt)的面部表情,Face2face软件可以从实时源中捕获动作,并将它们重新制定在数字目标上。但是在这种情况下,目标不是计算机生成的(尽管系统也可以做到这一点)。这是一个预先录制的RGB视频中的真实脸。

全屏宽度“width=
在这一中,您可以看到源演员(直播)和目标演员Putin(从剪辑中拉出),以及两个在实时重新制定中的网格。
face2face youtube视频的屏幕截图

标准相机是RGB - 他们记录来自红色,绿色和蓝色传感器的数据。运动捕获系统通常使用RGB-D摄像机(例如Microsoft Kinect),增加一个传感器的深度。

根据项目作者,还有其他面部运动捕获系统可与RGB录像一起使用,但不是实时的。

广告

在(小于)眼睛的眨眼

正如合着者Justus Thies所描述的,德国Erlangen-Nuremberg大学的计算机科学讲师,捕获和重新制定过程始于建模。该软件分析了源(现场表演者)的网络摄像头图像(Putin)(普京),收集有关面部特征和运动的数据。根据Thies的说法,它只需要大约六帧。然后,该软件使用此数据对软件数据库中最接近的匹配合成面模型进行调整,从而产生两张面的准确3-D模型。

然后,Thies在一封电子邮件中写道:“知道两个人的几何形状,我们能够根据新的变形转移技术将表达式从一个人转移到另一个人。”这是face2face独有的。它跟踪源面部模型“变形”以实现表达式的方式,并将这些相同的变形应用于目标的面部模型。

最终,该软件使用新的“变形”面模型重新呈现目标视频。Thies说,该系统的运行方式约为每秒28帧。这意味着每个视频框架的整个建模,捕获和重新制定过程大约需要0.04秒。以这种速度实现增强的现实主义是一项壮举。

Thies写道:“以前的实时运行的方法使用稀疏测量,例如,嘴巴,眼睛和轮廓周围的一些特征点。”另一方面,Face2face看着每个像素包含脸部。

Thies将实时完成所有这些操作的能力归因于“对现代GPU的有效实施”。

广告

超越电影

作者认为,Face2face最终可能会帮助好莱坞在CG面孔中产生更现实的表情,并对现场演员的面孔进行调整。它也非常适合外国电影配音,如果演员的嘴举动与翻译的对话相匹配,这可能更加可口。(Hotair.com海报奇迹詹姆斯·迪恩(James Dean)开始担任新角色之前,我们已经有多长时间了。)

然而,更值得注意的应用程序可能是日常应用程序。操纵面孔的能力不仅是现实的,而且是实时的,而且在在线目标中也提高了一些有趣的可能性。视频游戏化身在玩游戏时可以更准确地反映游戏玩家的面部表情。在国际电视会议和直播电视广播中,可以在直觉上重新渲染扬声器的嘴,以匹配翻译人员的话。作者在欺诈检测中看到了应用程序,该软件可以在其中找到面部不一致之处,“通过分析视频序列中的跟踪表达式并将其与参考视频序列进行比较”。

其中一些是有办法的。但是该项目仍在进行中。

就目前而言,它可以在一秒钟的时间里戴上弗拉基米尔·普京(Vladimir Putin)的脸上的大笑容,使它看起来真实。毫无疑问,这是视频医生的分数 - 但是指出在堆栈上,直到语音模拟达到相同的现实主义水平之前,视频证明仍然相对安全。

广告

特色

广告

加载...