新版DeepSeek-R1正式开源 编程能力强到离谱 一手实测来了
临近端午假期,DeepSeek果然又开始搞事。就在今天凌晨,新版DeepSeek-R1正式开源了!DeepSeek-R1-0528模型权重已上传到HuggingFace,不过模型卡暂未更新。 项目地址:https://huggingface.co/deepseek-ai/DeepSeek-...
你的专属IT资讯(IT News)
临近端午假期,DeepSeek果然又开始搞事。就在今天凌晨,新版DeepSeek-R1正式开源了!DeepSeek-R1-0528模型权重已上传到HuggingFace,不过模型卡暂未更新。 项目地址:https://huggingface.co/deepseek-ai/DeepSeek-...
中国AI初创公司 DeepSeek于周三上午通过微信宣布,其在开发者平台 Hugging Face上发布了其R1 推理 AI 模型的更新版本。 根据 DeepSeek 的微信公告,更新后的 R1 版本采用宽松的 MIT 许可证,这意味着它可以用于商业用途,这是一个“小”升级。 Huggin...
5月29日消息,让不少人意外的是,R2没有等来,却迎来了R1的小版本升级,但实测后实力依然惊人。 昨日晚间,DeepSeek在官方交流群中发布通知:DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。 有人实测了...
5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足了铺垫。 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到“极致降本”的。这篇论文也让业界得以一窥这家以技术立身的公司,其“内功”究竟修炼到了何种火候。 与此前发布的V3技术报...
“无人不识梁文锋。”这句话大概足以形容梁文锋今天在AI圈的地位:媒体想尽办法一访难求、投资人用尽手段一面难约。DeepSeek爆红后,其研发团队所在的北京融科资讯中心和杭州汇金国际大厦,一段时间内挤满了媒体和投资人,甚至众多慕名而来的网友,直接将北京融科资讯中心楼下的透明水牌,挤成了小红书...
5月14日消息,全球著名大模型整合应用平台Poe发布2025年春季AI模型使用趋势报告。 报告显示,在文本领域,OpenAI的GPT-4.1系列和谷歌的Gemini 2.5 Pro在发布后几周内市场份额迅速增加,分别约占10%和约5%。 而因为其他推理模型相继发布,且价格合理、功能更加强大...
DeepSeek昨天突然“摆烂”,大批网友吐槽点进去就疯狂转圈,根本没法用,随后DeepSeek瞬间成为微博热搜榜第二名。 有不少网友发文表示,自己的历史记录消失不见了,暂时还没有恢复;此外,还有网友称“DeepSeek总是崩溃,感觉还没有豆包好用。” 对此,有媒体向DeepSeek的内部...
微软副董事长兼总裁布拉德·史密斯 (Brad Smith)今天在参议院听证会上表示,出于数据安全和宣传方面的考虑,微软员工不得使用 DeepSeek 。“在微软,我们不允许员工使用 DeepSeek 应用程序,”史密斯说,他指的是 DeepSeek 的应用服务(可在桌面和移动设备上使用)。...
腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。该技术方案获得了DeepSeek公开致谢,称这是...
专注通用人工智能的中国科技企业——杭州深度求索人工智能基础技术研究有限公司(简称DeepSeek)近期在世界人工智能赛道上掀起了一股旋风。 从产品角度看,DeepSeek的开源推理模型免费商用,直接面向用户,并可支持具体的开发, 提供相关应用场景模式服务,支持联网搜索与深度思考模式的网络实...