AI

2024-12-05

英伟达提出全新 Star Attention:10 倍加速大语言模型推理,登顶 Hugging Face 论文榜

大模型如今已具有越来越长的上下文,而与之相伴的是推理成本的上升。英伟达最新提出的 Star Attention,能够在不损失精度的同时,显著减少推理计算量,从而助力边缘计算。 当下的手机及 AIPC 中都会安装本地大模型,然而上下文长度增加,推理时的计算成本也会显著增长。最明显的一个后果就...

进一步了解
2024-12-05

AI Pin 失利后,Humane 押注 CosmOS AI 生态系统

 12 月 5 日消息,Humane 公司今天(12 月 5 日)发布公告,介绍了名为 CosmOS 的 AI 系统,希望将其打造成手机、汽车和智能音箱等各种设备的核心平台。 IT之家援引科技媒体 The Verge 报道,Humane 公司此前推出的可穿戴 AI 设备 AI P...

进一步了解
2024-12-05

马斯克xAI超算将扩张十倍!100万个GPU值得英伟达开个分公司

马斯克的人工智能初创公司xAI正在以惊人的速度发展,其承诺将其在孟菲斯建设的超级计算机Colossus扩大十倍,以容纳超过100万个GPU。 大孟菲斯商会周三发表声明称,xAI的扩张行动已经开始,英伟达、戴尔和超微电脑也将在孟菲斯建立业务以协助扩张。据悉,当地还将成立一只xAI特别行动队,...

进一步了解