DeepSeek R2 归档

2025-08-19

预训练到头了，DeepSeek R2值得期待吗？

「预训练时代已经结束」，大牛在2024年年底的演讲依旧余音绕梁。一手将深度学习和 OpenAI 带到前所未有历史性高度的 Ilya Sutskever，曾罕见推荐并在个人社交媒体转发了MIT团队论文《The Platonic Representation Hypothesis》，这篇文章...

进一步了解

AI

2025-08-13

自家模型爆料 DeepSeek-R2本月要发布

ChatGPT-5已经发布，那么国产大模型DeepSeek大版本更新也就不远了。从网友向DeepSeek提出的问题看，该模型给出的答案是，DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。在这样的背景下，国产算力链多家公司股价出现了大涨，比如寒武纪直接今天20cm涨...

进一步了解

AI

2025-04-29

总参数量1.2万亿比R1提升1倍！曝DeepSeek R2将彻底摆脱NVIDIA：全部基于华为芯片

4月29日消息，年初DeepSeek R1的问世，让美国AI圈颤三颤，甚至引发了NVIDIA的股价暴跌。如今，更强的DeepSeek R2也要来了。据报道，市场最新爆料，R2大模型将采用更先进的混合专家模型（MoE），总参数量较前代R1提升约1倍，预计达1.2万亿（R1总参数量为6710...

进一步了解

AI / 硬件

2025-04-28

全网都在等梁文锋 DeepSeek R2发布倒计时？

五月将至，中美科技巨头或将迎来新一轮巅峰对决。先是在4月中旬，OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型；谷歌则拿出了Gemini 2.5 Flash Preview，一个混合推理模型；与谷歌同一天，豆包在杭州巡展中正式发布了1.5·深度思考模型，在多模态上展现出...

进一步了解

资讯

2025-04-27

泄漏的DeepSeek R2信息揭示其运用自主AI基础设施实现性能提升

据知名 AI 业内人士@iruletheworldmo 在 X 上透露，DeepSeek 凭借其 R1 模型席卷 AI 世界之后，目前正在准备发布一款据称性能得到大幅改进的全新 DeepSeek R2 模型。在华为 Ascend 910B 芯片集群、潜在的华为 Atlas 900 以及 D...

进一步了解

AI

2025-04-04

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址： https://arxiv.org/abs/2504.02495 现在，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。通过RL激励LLM...

进一步了解

AI

目录

热门文章

归档

搜索

DeepSeek R2

预训练到头了，DeepSeek R2值得期待吗？

自家模型爆料 DeepSeek-R2本月要发布

总参数量1.2万亿比R1提升1倍！曝DeepSeek R2将彻底摆脱NVIDIA：全部基于华为芯片

全网都在等梁文锋 DeepSeek R2发布倒计时？

泄漏的DeepSeek R2信息揭示其运用自主AI基础设施实现性能提升

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布

DeepSeek R2

预训练到头了，DeepSeek R2值得期待吗？

自家模型爆料 DeepSeek-R2本月要发布

总参数量1.2万亿 比R1提升1倍！曝DeepSeek R2将彻底摆脱NVIDIA：全部基于华为芯片

全网都在等梁文锋 DeepSeek R2发布倒计时？

泄漏的DeepSeek R2信息揭示其运用自主AI基础设施实现性能提升

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布

总参数量1.2万亿比R1提升1倍！曝DeepSeek R2将彻底摆脱NVIDIA：全部基于华为芯片