DINOv3不同尺寸模型效果比较
可以看到, 4个尺寸的模型都能较好的提取到图像的特征。实际使用时可以根据硬件情况合理选用, 不用盲目追求大的模型。选取 29M, 86M, 300M和840M 4个尺寸的模型进行特征可视化对比。
·
模型一览:
| Model | Parameters | Pretraining Dataset |
|---|---|---|
| ViT-S/16 distilled | 21M | LVD-1689M |
| ViT-S+/16 distilled | 29M | LVD-1689M |
| ViT-B/16 distilled | 86M | LVD-1689M |
| ViT-L/16 distilled | 300M | LVD-1689M |
| ViT-H+/16 distilled | 840M | LVD-1689M |
| ViT-7B/16 | 6,716M | LVD-1689M |
选取 29M, 86M, 300M和840M 4个尺寸的模型进行特征可视化对比。 结果如下:
可以看到, 4个尺寸的模型都能较好的提取到图像的特征。 实际使用时可以根据硬件情况合理选用, 不用盲目追求大的模型。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)