Video-R1 归档

2025-04-16

视频推理R1时刻，7B模型反超GPT-4o，港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型，首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集，Video-R1在视频空间推理测试中超越了GPT-4o，展现了强大的推理能力，并且全部代码和数据集均已开源。语言模型的推理刚火完，视频AI也开始「卷」起来...