支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型
1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。 IT之家从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Ins...
你的专属IT资讯
1 月 27 日消息,阿里通义千问今日宣布,正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。 IT之家从官方介绍获悉,通义千问本次发布了两个新的开源模型,分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Ins...
米哈游创始人蔡浩宇,“退休”后新 AI 创业项目曝光,起因竟是他在网上发的一条“暴论”。 AIGC 已经彻底改变了游戏开发…… 大部分从业者可以考虑转行了。 新公司名为 Anuttacon,要用 AI 为游戏玩家创造前所未有的体验,突破互动娱乐的界限。 是什么让这家公司与米哈游、蔡浩宇联系...
8 月 27 日消息,智谱 AI 今日宣布,GLM-4-Flash 大模型免费开放,通过智谱 AI 大模型开放平台调用。 GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,生成速度能达到 72.14 token/s,约等于 115 字符/s。 GL...
7 月 26 日消息,微软公司昨日(7 月 25 日)发布博文,宣布在 Azure 上支持开发者微调(fine-tune) Phi-3-mini 和 Phi-3-medium AI 模型,针对不同用例提高模型的性能。 例如,开发者可以微调 Phi-3-medium 模型,用于辅导学生;或者...
GPT-2 是 OpenAI 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 GPT-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。 据 Tom's Hardware 今日报道,前特斯拉 AI ...
近日,英特尔宣布在全新英特尔酷睿Ultra处理器上,有超过500款AI模型得以优化运行。这是市场上目前可用的业界出众的AI PC处理器,兼具全新AI体验、沉浸式图形和出色电池续航表现。这一重大里程碑是英特尔在客户端AI技术、AI PC转型、框架优化和包括OpenVINO工具包在内的AI工具...
微软推出了其轻量级人工智能模型 Phi-3 Mini 的下一个版本,这是该公司计划发布的三款小型模型中的第一款。Phi-3 Mini 可测量 38 亿个参数,其训练数据集比GPT-4 等大型语言模型要小。它现在可在 Azure、Hugging Face 和 Ollama 上使用。微软计划发...
3 月 28 日消息,初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。 DBRX 采用 transformer 架构,包含 1320 亿参数,共 16 个专家网络组成,每...