AI模型 归档

2025-01-27

支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

1 月 27 日消息，阿里通义千问今日宣布，正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。 IT之家从官方介绍获悉，通义千问本次发布了两个新的开源模型，分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Ins...

进一步了解

AI

2024-08-30

米哈游蔡浩宇新 AI 公司曝光：挖 Llama 3 科学家坐镇大模型，图形学大佬、基础设施老将加入

米哈游创始人蔡浩宇，“退休”后新 AI 创业项目曝光，起因竟是他在网上发的一条“暴论”。 AIGC 已经彻底改变了游戏开发…… 大部分从业者可以考虑转行了。新公司名为 Anuttacon，要用 AI 为游戏玩家创造前所未有的体验，突破互动娱乐的界限。是什么让这家公司与米哈游、蔡浩宇联系...

进一步了解

AI

2024-08-27

智谱 AI 宣布 GLM-4-Flash 大模型免费开放：支持中文、英语、日语、韩语等 26 种语言

8 月 27 日消息，智谱 AI 今日宣布，GLM-4-Flash 大模型免费开放，通过智谱 AI 大模型开放平台调用。 GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度能达到 72.14 token/s，约等于 115 字符/s。 GL...

进一步了解

AI

2024-07-26

微软现支持开发者微调 Phi-3-mini 和 Phi-3-medium AI 模型

7 月 26 日消息，微软公司昨日（7 月 25 日）发布博文，宣布在 Azure 上支持开发者微调（fine-tune） Phi-3-mini 和 Phi-3-medium AI 模型，针对不同用例提高模型的性能。例如，开发者可以微调 Phi-3-medium 模型，用于辅导学生；或者...

进一步了解

AI

2024-07-14

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 GPT-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。据 Tom's Hardware 今日报道，前特斯拉 AI ...

进一步了解

AI

2024-05-05

已有超过500款AI模型在英特尔酷睿Ultra处理器上得以优化运行

近日，英特尔宣布在全新英特尔酷睿Ultra处理器上，有超过500款AI模型得以优化运行。这是市场上目前可用的业界出众的AI PC处理器，兼具全新AI体验、沉浸式图形和出色电池续航表现。这一重大里程碑是英特尔在客户端AI技术、AI PC转型、框架优化和包括OpenVINO工具包在内的AI工具...

进一步了解

AI

2024-04-23

微软推出其规模最小的人工智能模型 Phi-3

微软推出了其轻量级人工智能模型 Phi-3 Mini 的下一个版本，这是该公司计划发布的三款小型模型中的第一款。Phi-3 Mini 可测量 38 亿个参数，其训练数据集比GPT-4 等大型语言模型要小。它现在可在 Azure、Hugging Face 和 Ollama 上使用。微软计划发...

进一步了解

AI

2024-03-28

号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，语言理解、编程能力等均超 GPT-3.5

3 月 28 日消息，初创公司 Databricks 近日发布公告，推出了开源 AI 模型 DBRX，声称是迄今为止全球最强大的开源大型语言模型，比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构，包含 1320 亿参数，共 16 个专家网络组成，每...

进一步了解

AI

目录

热门文章

归档

搜索

AI模型

支持 100 万 Tokens 上下文，阿里通义千问推出 Qwen2.5-1M 开源模型

米哈游蔡浩宇新 AI 公司曝光：挖 Llama 3 科学家坐镇大模型，图形学大佬、基础设施老将加入

智谱 AI 宣布 GLM-4-Flash 大模型免费开放：支持中文、英语、日语、韩语等 26 种语言

微软现支持开发者微调 Phi-3-mini 和 Phi-3-medium AI 模型

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

已有超过500款AI模型在英特尔酷睿Ultra处理器上得以优化运行

微软推出其规模最小的人工智能模型 Phi-3

号称全球最强开源 AI 模型，DBRX 登场：1320 亿参数，语言理解、编程能力等均超 GPT-3.5