麻省理工学院新研究:通过声音猜测人脸
- +1 你赞过了
【天极网网络频道】6月7日消息,麻省理工学院的研究人员训练了一个机器学习模型,只需根据一段简短的音频剪辑,就能重建出一个人非常粗糙的面部轮廓。
麻省理工学院的研究人员在Arxiv网站发表的一项研究中,创造了一种基于一小段音频剪辑来重建一些人粗糙相貌的方法。论文《Speech2Face:学习语音背后的面孔》,描述了他们如何从YouTube上获取数百万个剪辑组成的数据集,并创建了一个基于神经网络的模型,用于学习与视频中面部特征相关的声音属性。现在,当系统听到一个新的声音片段时,人工智能可以使用它学到的东西来猜测人脸的样子。
麻省理工学院的研究人员确实承认了论文中的隐私问题,并在“伦理考虑”部分解释说,Speech2Face通过训练可以捕捉性别和年龄等常见的视觉特征,并且只有当声音中有足够的证据时才这样做。换句话说,该系统并没有尝试或能够生成特定人物的图像。
尽管如此,研究人员推测,人工智能可能会支持一些应用,比如根据说话者的声音在语音或视频通话中附加一个代表性的面孔。
当然,最终产生的图像是非常粗糙的。但总体而言,其中许多照片的年龄、种族和性别都是正确的。之前的研究已经探索了通过语言预测年龄和性别的方法,但在这个案例中,研究者声称他们也发现了与一些面部模式的相关性。他们写道:“除了这些主要特征,我们的重建揭示了颅面部特征(如鼻子结构)和声音之间不可忽视的相关性。”
从可以在照片中自动标注某人的算法,到输入的文字可以用某人的声音读出来,再到用一种方法从声音中分辨出人脸是什么样的,人工智能变得越来越强大的同时,正让每个置身其中的人变得越来越透明,其带来的隐私问题值得我们关注。
最新资讯
热门视频
新品评测