微软开发出一种可在CPU上运行的超高效AI模型
微软研究人员声称,他们已经开发出迄今为止规模最大的1比特人工智能模型,也称为“Bitnets”。该模型名为BitNet b1.58 2B4T,在MIT许可下公开可用,可在包括苹果M2在内的CPU上运行。 Bitnets本质上是设计用于在轻量级硬件上运行的压缩模型。在标准模型中,权重(定义模...
你的专属IT资讯
微软研究人员声称,他们已经开发出迄今为止规模最大的1比特人工智能模型,也称为“Bitnets”。该模型名为BitNet b1.58 2B4T,在MIT许可下公开可用,可在包括苹果M2在内的CPU上运行。 Bitnets本质上是设计用于在轻量级硬件上运行的压缩模型。在标准模型中,权重(定义模...
OpenAI 表示,它部署了一个新系统来监控其最新的 AI 推理模型o3 和 o4-mini ,以检测与生物和化学威胁相关的提示。根据 OpenAI 的安全报告,该系统旨在防止这些模型提供可能指导某人实施潜在有害攻击的建议。 OpenAI 表示,O3 和 o4-mini 的性能较之前的模型...
港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,展现了强大的推理能力,并且全部代码和数据集均已开源。 语言模型的推理刚火完,视频AI也开始「卷」起来...
Llama 4诞生不过3天,反手就被超越了。 刚刚,英伟达官宣开源“超大杯”Llama Nemotron推理模型,共有253B参数,基于Llama-3.1-405B微调而来。 在多项基准测试中,Llama Nemotron一举击败了两款Llama 4模型。而且仅用一半的参数,性能直逼Dee...
就在刚刚,OpenAI宣布在其API中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音Agent。 新产品的核心亮点概述如下: gpt-4o-transcribe(语音转文本):单词错误率(WER)显著降低,在多个基准测试中优于现有Whisper模型 g...
LG AI Research,是的,就是那个开发消费电子产品的 LG,推出了 EXAONE Deep,这是一款高性能推理人工智能,尽管参数数量相对较少,但在数学逻辑、科学概念和编程挑战方面表现出了非凡的能力。 旗舰产品 32B 模型的性能指标可与 GPT-4o 和 DeepSeek R1 ...
当地时间周三,谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。 谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。 据谷歌介绍,其中一款名为Ge...
美国弧形研究所19日在官网发布公报说,来自该研究所、美国芯片制造商英伟达公司和美国斯坦福大学等机构的研究人员共同开发的人工智能(AI)生物学模型Evo 2当天正式发布。 公报说,在前一代模型Evo 1的基础上,Evo 2发展成为目前生物学领域规模最大的AI模型。该模型基于超过12.8万个基...
2月20日消息,据报道,微软近日发布了一款名为Muse的生成式人工智能模型,宣称将彻底革新视频游戏场景的制作方式。 作为微软在游戏开发领域的重要技术突破,Muse由机器学习研究团队主导开发,其独特之处在于能够自动生成游戏视觉内容和控制器动作,为游戏创作带来革命性变化。 Muse的开发得益于...
据上周五发布的一篇新研究论文,斯坦福大学和华盛顿大学的AI研究人员能够以不到50美元的云计算积分训练 AI“推理”模型。该模型称为s1,在测量数学和编码能力的测试中,其性能类似于 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型。GitHub提供了 s1 模型,以及用...