三星新开发的AI模型 是如何让蒙娜丽莎开口说话的
- +1 你赞过了
【天极网网络频道】近日,三星开发了一个新的AI模型,该模型能够在不需要使用3D建模的前提下,来将静止的图像转换为对话状态下的视频,其具体表现效果如下。
这种冲击,犹如哈利波特第一次看到学校石墙上的肖像开口说话一样。借助这一技术,未来你不仅将会看到蒙娜丽莎开口说话,甚至还能看到爱因斯坦打哈欠。
而在蒙娜丽莎这一案例中,仅使用了三个不同的视频便完成了动画上的制作,效果正如看到的一样,在面部结构和行为方面产生了截然不同的效果。
这一技术的实现,核心之一在于那个拥有超过7000个名人图像、百万张户外拍摄的面部轨迹、以及2000小时的对话音频和视频记录所组成的数据库VoxCeleb。
借助卷积神经网络CNN的特性,通过特征检测层对VoxCeleb中的数据进行学习,处理图像堆栈并识别图像中的内容。之后通过生成对抗网络,对人脸五官特征进行辨识,来过滤创建的各种模型,最终将符合的模型应用于视频之上。
目前,卷积神经网络这一技术,已经被广泛用于网络上的图像搜索和自动驾驶技术方面,未来当算法改进或训练模型变得更有效时,生成的效果也将更为逼真。
从好的方面来说,借助这一技术,你可以让自己的爱人或是影星永远停留在你印象中的那个时期,或是将自己的虚拟形象放到各类应用当中。总之这是一个很具潜力的技术,而随着AI技术的不断突破,未来生成的效果、成本以及时间都将会大幅提升。
同样令人担心的是,该技术能够仅凭一张图片便可让照片“活起来”,这也引起了一些技术专家和评论员担心,未来该技术将如何发展,还值得商榷。不过目前,这一技术仅用于脸部和上半身,还无法做到让蒙娜丽莎抬起双手或是跳舞等行为。
最新资讯
热门视频
新品评测