GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类
GPT-4o会画吉卜力、会「自拍」,但是能拼好乐高吗? 你有没有想过这样的问题: 多模态大语言模型真的具备理解和推理空间结构的能力吗? 在多步空间推理任务上,现有 MLLMs 究竟表现得如何? 近年来,随着多模态大语言模型的迅速发展,视觉理解、图文对齐、语言生成等能力不断突破,仿佛人类助手...

你的专属IT资讯(IT News)
GPT-4o会画吉卜力、会「自拍」,但是能拼好乐高吗? 你有没有想过这样的问题: 多模态大语言模型真的具备理解和推理空间结构的能力吗? 在多步空间推理任务上,现有 MLLMs 究竟表现得如何? 近年来,随着多模态大语言模型的迅速发展,视觉理解、图文对齐、语言生成等能力不断突破,仿佛人类助手...
Instagram今天推出了一款视频编辑应用 Edits,填补了字节跳动旗下 CapCut 应用今年早些时候下架后留下的空白。CapCut 和 TikTok 一样,也从App Store下架,但与后者不同的是至今仍未回归。 CapCut 从 App Store 下架后不久,Instagra...
周二,xAI 宣布推出 Grok Vision,用户可以使用手机对准产品、标识和文件等物体,并提出相关问题。Grok Vision 可通过 iOS 版 Grok 应用访问,但目前还无法通过 Android 版 Grok 应用访问。 Grok 今天推出的其他新功能包括多语言音频和 Grok ...
据彭博社报道,苹果公司新任Siri工程主管迈克·罗克韦尔(Mike Rockwell)正在重组负责开发该语音助手的管理团队,他向员工保证此举将为公司的成功奠定基础。此前,Siri的开发已陷入困境。 Siri是苹果AI系统的重要组成部分 知情人士透露,罗克韦尔正在用他此前在Vision Pr...
4月23日消息,今年首个A级车展——第二十一届上海车展正式启幕。 据悉,上海车展每两年举办一次,本届上海车展共邀请到来自26个国家和地区的近1000家中外知名企业参展,展出总面积超过36万平方米,参展国别范围更广,规模再创新高。 在上海车展开幕前两周,各车企就已经开启紧锣密鼓的产品上新。 ...
AMD发布了最新的Adreno 25.4.1版显卡驱动(可选测试版),首发支持刚刚上市的《上局卷轴4:湮灭重制版》,还加入了多款FSR 4游戏。 它们分别是:《上局卷轴4:湮灭重制版》《刺客信条:影》《天国:拯救2》《真三国无双:起源》《文明7》《永劫无间》。 不过AMD提醒,Window...
4月23日消息,今日,联想拯救者官微公布拯救者Y700四代核心配置参数,并且还和iPad mini 7进行对比,官方称“优势对位 更进一步。” 拯救者Y700四代长207.58mm,宽128.5mm,比iPad mini 7更窄、屏占比更高,更适合单手握持,不过重量为3...
在反垄断大棒持续击打Google、要求剥离Chrome的同时,OpenAI已经迫不及待的表示,自己想要“接盘”了。 北京时间4月23日凌晨,在关于是否要求Google分拆Chrome审判的第二天,美国司法部请到的证人之一,是OpenAI ChatGPT产品负责人尼克·特利(Nick Tur...
一边发布第二代神行超充电池,一边大力推进巧克力换电;既布局储能市场,又探索机器人、低空经济等前沿领域。宁德时代似乎想从电池企业的定位出发,走得更远。 尤其是在4月21日公开发布新超充电池的钠离子电池后,外界更是意外:之前还说超充不如换电,转头仍然是“我全都要”,巨头的言论果然总是从利益出发...
当大家都去挖金矿时,卖铲子的最赚钱。 在19世纪的美国加州,无数怀揣财富梦想的人涌入金矿,却鲜有人意识到,真正赚得盆满钵满的并非矿工,而是那些贩卖铲子、牛仔裤的商人。如今,大模型掀起的“淘金热”席卷全球,在这场技术与商业的狂欢中,AI基础设施(AI Infra)正扮演着类似“卖铲人”的关键...