新论文暗示DeepSeek V4已完成训练
刚刚过去的2025年中,万众期待的DeepSeek全新大模型没有问世,但是DeepSeek并没有闲着,这一年中继续打磨了DeepSeek V3.X大模型,还发布了多项新技术。2026年元旦假期,DeepSeek又发了一个新论文,提出了名为“流形约束超连接”(mHC)的框架,又一次引发了热议...
你的专属IT资讯(IT News)
刚刚过去的2025年中,万众期待的DeepSeek全新大模型没有问世,但是DeepSeek并没有闲着,这一年中继续打磨了DeepSeek V3.X大模型,还发布了多项新技术。2026年元旦假期,DeepSeek又发了一个新论文,提出了名为“流形约束超连接”(mHC)的框架,又一次引发了热议...
坏消息,开源模型和闭源模型的差距越来越大了。 好消息,DeepSeek 又出手了。 12 月 1 日,DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。 前者和 GPT-5 能打的有来有回,后面的高性能版更是直接把 GP...
DeepSeek开源“奥数金牌级”新模型,超越谷歌的IMO金奖“得主”DeepThink模型。 可自我验证的AI系统,离解决研究级数学问题更进一步。 智东西11月27 日报道,今日,DeepSeek开源了“奥数金牌级”模型DeepSeekMath-V2,该模型具备强大的定理证明能力。 De...
11月3日消息,就在刚刚,有不少网友反馈DeepSeek崩了。 有网友发帖称,自己正在使用DeepSeek时,居然遇到了“服务器繁忙,请稍后重试”的提醒。 有网友发帖称:“原来是崩了,我还以为我网不好呢,快恢复啊我要做水课作业 。”、“谁懂我写小说写到一半然后崩了无法进行的痛。” 今年8月...
最近 AI 圈又出新花活儿了,DeepSeek 团队悄咪咪地开源了一个 30 亿参数的小模型,名叫DeepSeek-OCR。 别看体量不大,想法可是够炸的:他们居然打算让 AI用看图的方式去读文本。 没错,真“看图识字”。 而且不只是识字,而是让“视觉模态”成为一种文本压缩介质,...
DeepSeek 又整出新东西来了,只用到原本十分之一 token,就能存下几乎一样的文字信息,这压缩比,香农看了都要流泪,冯·诺伊曼看了都要沉默。 更是直接把一堆老外给钓成了翘嘴。 昨天,DeepSeek 发布了新模型 DeepSeek-OCR,OCR 这东西咱们都熟悉,就是把图片里的文...
DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。 唯一的问题可能就是被“OCR”命名耽误了。 是的,DeepSeek刚刚开源即火爆的模型就叫:DeepSeek-OCR...
DeepSeek-OCR用少量视觉token解码10倍文本,高效压缩视觉信息。 一图胜千言!DeepSeek-OCR模型大胆探索视觉-文本压缩边界。通过少量视觉token解码出10倍以上的文本信息,这款端到端VLM架构不仅在OmniDocBench基准上碾压GOT-OCR2.0,还为LLM...
10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。 该模型核心由DeepEncoder与DeepS...
DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。 开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。 海外社区也注意到DeepSeek使用了它而不是OpenAI开发的Triton语言。 ...