预训练到头了,DeepSeek R2值得期待吗?
「预训练时代已经结束」,大牛在2024年年底的演讲依旧余音绕梁。 一手将深度学习和 OpenAI 带到前所未有历史性高度的 Ilya Sutskever,曾罕见推荐并在个人社交媒体转发了MIT团队论文《The Platonic Representation Hypothesis》,这篇文章...
你的专属IT资讯
「预训练时代已经结束」,大牛在2024年年底的演讲依旧余音绕梁。 一手将深度学习和 OpenAI 带到前所未有历史性高度的 Ilya Sutskever,曾罕见推荐并在个人社交媒体转发了MIT团队论文《The Platonic Representation Hypothesis》,这篇文章...
ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。 在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨...
4月29日消息,年初DeepSeek R1的问世,让美国AI圈颤三颤,甚至引发了NVIDIA的股价暴跌。如今,更强的DeepSeek R2也要来了。 据报道,市场最新爆料,R2大模型将采用更先进的混合专家模型(MoE),总参数量较前代R1提升约1倍,预计达1.2万亿(R1总参数量为6710...
五月将至,中美科技巨头或将迎来新一轮巅峰对决。先是在4月中旬,OpenAI一口气发布了GPT-4.1 o3、o4 mini系列模型;谷歌则拿出了Gemini 2.5 Flash Preview,一个混合推理模型;与谷歌同一天,豆包在杭州巡展中正式发布了1.5·深度思考模型,在多模态上展现出...
据知名 AI 业内人士@iruletheworldmo 在 X 上透露,DeepSeek 凭借其 R1 模型席卷 AI 世界之后,目前正在准备发布一款据称性能得到大幅改进的全新 DeepSeek R2 模型。在华为 Ascend 910B 芯片集群、潜在的华为 Atlas 900 以及 D...
DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 论文地址: https://arxiv.org/abs/2504.02495 现在,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。 通过RL激励LLM...