空间-时间表示

共 1 篇网址

排序

发布更新浏览点赞

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

748326

AI开源项目 # AI开源项目 # Transformer模型 # 多模态学习