阿里通义千问推出QVQ-Max视觉推理模型:有“眼力”,更有“脑力”
阿里通义千问团队发文宣布,正式推出QVQ-Max视觉推理模型第一版。该团队表示,去年12月发布的探索模型QVQ-72B-Preview存在一些不足,而新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。 从数学题到生...
你的专属IT资讯(IT News)
阿里通义千问团队发文宣布,正式推出QVQ-Max视觉推理模型第一版。该团队表示,去年12月发布的探索模型QVQ-72B-Preview存在一些不足,而新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。 从数学题到生...
3月28日消息,凌晨三点,阿里在X上发布视觉推理模型QVQ-Max。作为QVQ-72B-Preview的升级版,官方表示,新模型针对传统AI在视觉信息处理上的不足进行了优化,增强了从视觉感知到认知推理的能力。 QVQ-Max支持图像、视频与文本的联合推理。在MathVision bench...