美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5
9月23日消息,美团LongCat团队正式发布全新高效推理模型——LongCat-Flash-Thinking。 在保持了LongCat-Flash-Chat极致速度的同时,全新发布的LongCat-Flash-Thinking更强大、更专业。 综合评估显示,LongCat-Flash-T...
你的专属IT资讯
9月23日消息,美团LongCat团队正式发布全新高效推理模型——LongCat-Flash-Thinking。 在保持了LongCat-Flash-Chat极致速度的同时,全新发布的LongCat-Flash-Thinking更强大、更专业。 综合评估显示,LongCat-Flash-T...
今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。 Seed-OSS系列模型是推理模型,专门针对推理任务进行了...
NVIDIA 今天发布了 OpenReasoning-Nemotron,这是由四个精简的推理模型组成的集合,参数分别为 15 亿、70 亿、140 亿和 320 亿,均源自拥有 671 亿参数的 DeepSeek R1 0528。通过将庞大的“老师”模型压缩成四个基于 Qwen-...
法国人工智能公司 Mistral 将于周二发布其首款推理模型,与 OpenAI 和中国的深度求索(DeepSeek)等公司展开竞争。Mistral 首席执行官亚瑟・门施(Arthur Mensch)周二告诉美国消费者新闻与商业频道(CNBC),新推出的 Magistral 模型专注于欧洲语...
苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。 再遇到真正高复杂度的任务时所有模...
「o3 达到或接近天才的水平。」 就在刚刚,OpenAI o3/o4 mini 模型终于正式推出。 直播用时接近 30 分钟,节奏快到飞起,信息量却满满当当。 o3 的发布历程本身也极具反转,今年 2 月,OpenAI 曾宣布搁置 o3 的独立发布计划,技术会打包塞进 GPT-5 里。到了...