Facebook新AI模型可能给计算机视觉带来革命

发布时间：2021-04-01 10:46:49 所属栏目：外闻来源：互联网

导读：的计算机视觉的自监督模型相比，SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。 ImageNet是一个大规模数据库，包含研究人员标记的数百万张图片，并向较大的计算机视觉社区开放，以促进AI的发展。该项目的数据库被Facebook的研究人

的计算机视觉的自监督模型相比，SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。”

ImageNet是一个大规模数据库，包含研究人员标记的数百万张图片，并向较大的计算机视觉社区开放，以促进AI的发展。

该项目的数据库被Facebook的研究人员用作评估SEER性能的基准，他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。

Goyal说：“通过仅对随机图像进行训练，SEER优于现有的自监督模型。这一结果表明，我们不需要像ImageNet这样的高度精选的数据集，对随机图像的自监督学习就可以产生非常高质量的模型。”

随着自监督学习复杂度的提高，研究人员的工作并非没有挑战。在文本方面，AI模型的任务是为单词赋予含义。但是对于图像，该算法必须决定每个像素如何与一个概念相对应，同时考虑到其在不同图片中拍摄角度、视图和形状的差别。

换句话说，研究人员需要大量数据，并且需要一个能够从这种复杂的信息池中推导出所有可能的视觉概念。

为了完成此任务，Goyal和她的团队从Facebook AI在自监督学习中的现有工作中改编了一种新算法，称为SwAV，该算法将显示相似的图像聚集到单独的组中。科学家还设计了卷积网络，也就是一种深度学习算法，算法对人脑中神经元的连接模式进行建模，根据重要性分配给图像中的不同对象。

至少可以说，借助instagram的10亿张图片的数据集，该系统的规模很大。Facebook的团队使用了具有32GB RAM的V100 Nvidia GPU，并且随着模型尺寸的增加，必须将模型放入可用的RAM中。但是Goyal解释说，进一步的研究将对确保计算功能适应新系统很有用。

“随着我们在越来越多的GPU上训练模型，这些GPU之间的通信需要快速进行。可以通过开发软件来解决给定的内存和运行时间带来的挑战.”她说。

尽管仍有许多工作要做，但是，在可以将SEER应用于现实世界的用例之前，Goyal认为不应低估该技术的影响。她说：“借助SEER，我们现在可以通过大量随机的互联网上的图像训练大型模型，在计算机视觉方面取得更大的进步。”

“这一突破可以实现计算机视觉的自监督学习革命，类似于我们在自然语言处理文本中所看到的。”

（编辑：PHP编程网 - 黄冈站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

星际碰撞可产生六方金	NASA将计划周三对登月
实验室创出迄今最冷物	神经机器人系统解码帕