推理模型

2025-08-21

字节首次开源推理模型 连夺7项第一

今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。 Seed-OSS系列模型是推理模型,专门针对推理任务进行了...

进一步了解
2025-06-11

Mistral将推出其首款推理模型 挑战 OpenAI

法国人工智能公司 Mistral 将于周二发布其首款推理模型,与 OpenAI 和中国的深度求索(DeepSeek)等公司展开竞争。Mistral 首席执行官亚瑟・门施(Arthur Mensch)周二告诉美国消费者新闻与商业频道(CNBC),新推出的 Magistral 模型专注于欧洲语...

进一步了解
2025-06-10

苹果炮轰推理模型全是假思考,4个游戏戳破神话,o3/DeepSeek高难度全崩溃

苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。 再遇到真正高复杂度的任务时所有模...

进一步了解