MIT新突破:让视频识别模型的训练速度提升三倍
- +1 你赞过了
【天极网网络频道】10月10日消息,机器学习使计算机能够识别人脸和医学影像。但当它的任务是解释视频和真实世界的事件时,有可能会让机器学习模型变得庞大而繁琐。
据外媒报道,日前,MIT-IBM沃森人工智能实验室的一个团队已经找到了一种解决方案。研究人员创建了一个模型,可以加快视频识别模型的训练速度,同时也可以缩小模型的大小。
这一研究的关键就在于改变视频识别模型查看时间的方式。当前的模型将时间的流逝编码成一系列的图像,这就产生了更大的、计算密集型的模型。MIT-IBM沃森人工智能实验室的研究人员设计了一个时间移位模块,它给模型一种时间流逝的感觉,而不需要显式地表示时间。经过一系列测试,该模型的执行速度比当前模型快三倍。
时间移位模块使得在移动设备上运行视频识别模型变得更加容易。麻省理工学院助理教授Song Han表示,“我们的目标是让所有人都能使用低功耗的人工智能设备。要做到这一点,我们需要设计出高效的人工智能模型,这种模型能耗更低,能够在有大量人工智能活动的边缘设备上顺畅运行。”
据了解,研究人员将在2019国际计算机视觉大会(International Conference onComputer Vision)上发表他们的研究成果。
通过减少训练所需的算力,该方法也可能有助于减少人工智能的碳足迹。它可以帮助视频、社交等平台发现暴力或恐怖镜头。同时,还可以让医疗机构在本地运行人工智能应用程序,保障了数据的安全。
最新资讯
热门视频
新品评测