模型一览:

Model Parameters Pretraining Dataset
ViT-S/16 distilled 21M LVD-1689M
ViT-S+/16 distilled 29M LVD-1689M
ViT-B/16 distilled 86M LVD-1689M
ViT-L/16 distilled 300M LVD-1689M
ViT-H+/16 distilled 840M LVD-1689M
ViT-7B/16 6,716M LVD-1689M

选取 29M, 86M, 300M和840M 4个尺寸的模型进行特征可视化对比。 结果如下:
请添加图片描述

可以看到, 4个尺寸的模型都能较好的提取到图像的特征。 实际使用时可以根据硬件情况合理选用, 不用盲目追求大的模型。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐