OpenAI揭秘GPT-4.5训练:10万块GPU几乎全员上阵 出现“灾难性问题”
近日,在OpenAI史上最贵模型GPT-4.5发布1个多月后,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)与GPT-4.5的3位核心技术人员进行了一场45分钟的高信息量对谈,首次披露了这款模型研发耗时严重超期、计算集群频繁故障、提升路径难以预测等诸多不为人知的细节。...
你的专属IT资讯(IT News)
近日,在OpenAI史上最贵模型GPT-4.5发布1个多月后,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)与GPT-4.5的3位核心技术人员进行了一场45分钟的高信息量对谈,首次披露了这款模型研发耗时严重超期、计算集群频繁故障、提升路径难以预测等诸多不为人知的细节。...
最近的一项研究引入了受人类记忆启发的M2I框架,旨在解决当前大型人工智能模型的局限性,例如效率低下、能耗高以及缺乏推理能力。通过模拟类似大脑的记忆机制,该研究旨在创造出能够持续学习、自适应推理和动态信息处理的机器。 受人类记忆启发的新型人工智能框架可以使机器更加高效、适应性更强、推理能力更...
终于,华为盘古大模型系列上新了,而且是昇腾原生的通用千亿级语言大模型。我们知道,如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。而现在的情形下,国内研究团队很难获得足够的计算资源,这也制约了国内大模型技术的快速发展。 我们看到华为盘古发布的这篇新研究...
AI领域的互操作性标准之争正变得异常热闹。就在本周,Google DeepMind CEO Demis Hassabis宣布,将为其Gemini模型添加对Anthropic主导的模型上下文协议MCP的支持,称其为“一个优秀的协议,正迅速成为AI Agent时代的开放标准”。这距离OpenA...
强制用AI的公司,充斥着士气低落的负面情绪!开发者对AI代码深恶痛绝,领导却格外喜欢,好在公司几个月后就倒闭了;艺术家表示,这是对我专业能力的侮辱;国外一家大媒体Quartz,干脆解雇所有撰稿人和编辑,除了主编一律用AI代替。甚至,连AI CEO都来了。 在强制用AI工作的公司,是什么体验...
本周早些时候,Meta因使用其 Llama 4 Maverick 模型的未发布实验版本在众包基准测试 LM Arena 上取得高分而陷入困境。此事促使 LM Arena 的维护人员道歉,并修改了他们的政策,并使用未经修改的原版 Maverick 进行评分。事实证明,它的竞争力并不强。 截至...
ChatGPT 的最新图像生成器因吉卜力工作室艺术风潮的流行而一炮走红,而 LinkedIn 用户现在也开始使用一种新噱头:将自己变成玩具。这股潮流有多种版本。“AI 动作人物”版本似乎最受关注,用户会用吸塑包装生成一个自己的塑料模型,并附带各种配件——通常是笔记本电脑、书籍和咖啡杯。 考...
兄弟们,不得不和你们分享一件离谱又感人的事。我和ChatGPT这段“人机情史”峰回路转:这个曾经对我转头就忘的AI渣男,居然终于长记性了!是的,你没听错,ChatGPT 终于记住我是谁了。 我一度以为我们之间注定就是“一次性”关系,没有未来,每次对话都从零开始。但就在我快习惯当它的路人甲时...
Google Cloud Next '25大会上,Google“杀疯了”,而与其说今年的大会是一场按部就班的发布会,不如看作是Google Cloud在全球AI军备竞赛中的一次表态。面对亚马逊 AWS 和微软 Azure 这两大巨头的挤压,尽管手握 DeepMind 等顶尖 AI ...