推理模型 归档

2025-09-23

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日消息，美团LongCat团队正式发布全新高效推理模型——LongCat-Flash-Thinking。在保持了LongCat-Flash-Chat极致速度的同时，全新发布的LongCat-Flash-Thinking更强大、更专业。综合评估显示，LongCat-Flash-T...

进一步了解

AI

2025-08-21

字节首次开源推理模型连夺7项第一

今天，字节跳动Seed团队开源了Seed-OSS系列模型，这些模型专为长上下文、推理、Agent和通用场景设计，将上下文窗口扩展至512k，是业界常见上下文窗口（128k）的4倍，GPT-5上下文窗口的2倍，相当于1600页文本。 Seed-OSS系列模型是推理模型，专门针对推理任务进行了...

进一步了解

AI

2025-07-20

NVIDIA 为消费者带来 15 亿至 320 亿个参数的推理模型

NVIDIA 今天发布了 OpenReasoning-Nemotron，这是由四个精简的推理模型组成的集合，参数分别为 15 亿、70 亿、140 亿和 320 亿，均源自拥有 671 亿参数的 DeepSeek R1 0528。通过将庞大的“老师”模型压缩成四个基于 Qwen-...

进一步了解

AI

2025-06-11

Mistral将推出其首款推理模型挑战 OpenAI

法国人工智能公司 Mistral 将于周二发布其首款推理模型，与 OpenAI 和中国的深度求索（DeepSeek）等公司展开竞争。Mistral 首席执行官亚瑟・门施（Arthur Mensch）周二告诉美国消费者新闻与商业频道（CNBC），新推出的 Magistral 模型专注于欧洲语...

进一步了解

AI

2025-06-10

苹果炮轰推理模型全是假思考，4个游戏戳破神话，o3/DeepSeek高难度全崩溃

苹果最新大模型论文，在AI圈炸开了锅。有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。这篇论文称推理模型全都没在真正思考，无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”，所谓思考只是一种假象。再遇到真正高复杂度的任务时所有模...

进一步了解

AI

2025-04-17

刚刚，OpenAI 最强推理模型 o3 发布，首次能用图片思考，奥特曼：天才水平

「o3 达到或接近天才的水平。」就在刚刚，OpenAI o3/o4 mini 模型终于正式推出。直播用时接近 30 分钟，节奏快到飞起，信息量却满满当当。 o3 的发布历程本身也极具反转，今年 2 月，OpenAI 曾宣布搁置 o3 的独立发布计划，技术会打包塞进 GPT-5 里。到了...

进一步了解

AI

目录

热门文章

归档

搜索

推理模型

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

字节首次开源推理模型连夺7项第一

NVIDIA 为消费者带来 15 亿至 320 亿个参数的推理模型

Mistral将推出其首款推理模型挑战 OpenAI

苹果炮轰推理模型全是假思考，4个游戏戳破神话，o3/DeepSeek高难度全崩溃

刚刚，OpenAI 最强推理模型 o3 发布，首次能用图片思考，奥特曼：天才水平

推理模型

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

字节首次开源推理模型 连夺7项第一

NVIDIA 为消费者带来 15 亿至 320 亿个参数的推理模型

Mistral将推出其首款推理模型 挑战 OpenAI

苹果炮轰推理模型全是假思考，4个游戏戳破神话，o3/DeepSeek高难度全崩溃

刚刚，OpenAI 最强推理模型 o3 发布，首次能用图片思考，奥特曼：天才水平

字节首次开源推理模型连夺7项第一

Mistral将推出其首款推理模型挑战 OpenAI