SAM 2:分割图像和视频中的任何内容

9 阅读 0 评论 0 点赞

文章目录

摘要
1 引言
2 相关工作
3 任务：可提示视觉分割
4 模型
5 数据
- 5.1 数据引擎
- 5.2 SA-V数据集
6 零样本实验
7 与半监督VOS的最新技术的比较
8 数据和模型消融
9 结论
10 致谢
附录

摘要

我们提出了“Segment Anything Model 2”（SAM 2），这是一种基础模型，旨在解决图像和视频中的可提示视觉分割问题。我们构建了一个数据引擎，该引擎通过用户交互改进模型和数据，以收集迄今为止最大的视频分割数据集。我们的模型采用带有流式内存的简单变换器架构，适用于实时视频处理。使用我们的数据进行训练的SAM 2在广泛的任务中表现出色。在视频分割方面，我们观察到比先前方法更高的准确性，同时所需的交互次数减少了 $3$ 倍。在图像分割方面，我们的模型比“Segment Anything Model”（SAM）更准确，速度快了

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

转载请注明出处：免费源码网-免费的源码资源网站 » SAM 2:分割图像和视频中的任何内容

点赞(0) 打赏

本文分类：文章资讯
本文标签：SAM 2:分割图像和视频中的任何内容
浏览次数：9 次浏览
本文链接：https://freeymw.com/article/26781.html

上一篇 > 设计模式 | 单例模式
下一篇 > 基于CNN(一维卷积Conv1D)实现降雨多变量时序分类——明日是否降雨

SAM 2:分割图像和视频中的任何内容

文章目录

摘要

评论列表共有 0 条评论

发表评论取消回复

SAM 2:分割图像和视频中的任何内容

文章目录

摘要

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复