Facebook的母公司Meta公司发布了一个新的人工智能模型,它可以识别图像中的单个物体。它还可以根据输入模型的文本来选择它们。
该工具名为Segment Anything,其工作原理是识别哪些图像像素属于某个物体。它被作为一个项目推出,该项目不仅包括模型,还包括一个任务和数据集作为其研究论文的一部分。
该模型本身被命名为Segment Anything Model(SAM),数据集被命名为Segment Anything 1-Billion mask dataset(SA-1B),被Meta公司吹捧为有史以来最大的分割数据集,以实现一系列广泛的应用。该数据集将被用于研究目的,该模型在允许的开放许可(Apache 2.0)下可用。
Meta进一步说,SAM可以被用来为那些需要在众多领域的任何图像中寻找和分割任何物体的应用提供动力。该模型本身在未来也可以成为能力更强、范围更广的人工智能的一个组成部分,并可用于增强AR和VR应用,根据用户的视线选择物体。
基于SAM的技术已经在Meta内部使用,特别是在Facebook和Instagram上,用户对照片进行标记,对禁止的内容进行审核,也为决定向用户展示哪些帖子的算法提供信息。
Meta公司已经推出了一个在线模型演示,任何人都可以用自己的图片尝试,看看人工智能的能力。
有条件的朋友可以去试试:https://segment-anything.com/