OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换
9月1日消息,OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、...
你的专属IT资讯(IT News)
9月1日消息,OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、...
早在 2024 年 10 月,OpenAI就发布了Realtime API,使开发者能够在其应用中构建低延迟、多模式的体验。自那时起,成千上万的开发者已经使用 Realtime API 在其应用和服务中构建了自然的语音转语音体验。今天,OpenAI 发布了其最先进的语音转语音模型 GPT-...
在生命科学领域,一个长期未解的难题是:如何高效地将成体细胞逆转为多能干细胞。传统方法依赖一种称为“山中因子”的蛋白质。只要把它导入成体细胞,就能把它们“重编程”为诱导多能干细胞(iPSCs)。这种“细胞逆转”,能让普通的体细胞回到像胚胎一样的状态,从此人类就有可能再生各种组织,甚至治愈那些...
美东时间周三,OpenAI首席财务官萨拉·弗里尔(Sarah Friar)对外证实,该公司正在考虑在未来的某个时候进行首次公开募股(IPO)。这是该公司高管首次就公开上市的可能性发表直接声明。 OpenAI成立于2015年,一直保持着私营状态,目前已经是全球估值最高的独角兽之一。 虽然弗里...
OpenAI财务主管 Sarah Friar 周三表示,即使公司达到了收入里程碑,但仍面临着来自人工智能计算需求的持续压力。她周三在接受 CNBC 的“Squawk Box”节目采访时表示:“现在对 GPU 和计算的需求非常旺盛。我们面临的最大问题是计算能力持续不足。这就是我们推出‘星际之...
为什么GPT-5会让老用户失望,但免费用户沸腾到要限流? 为什么一个聊天模型,会突然懂得「花钱买成果」? 为什么OpenAI用GPT-5在下一盘大棋,可能让广告公司和搜索引擎都睡不着? 答案,全藏在一个看似普通的技术名词里——路由器。 它不仅能决定GPT-5的「智商」,也决定了OpenAI...
上周,OpenAI的o3模型在人工智能(AI)国际象棋比赛中击败了xAI的Grok 4,赢得了冠军。该比赛名为“人工智能国际象棋表演赛”,在谷歌旗下的Kaggle平台上举行,八个AI模型在三天淘汰赛中决出冠亚季军。 比赛要求AI模型要在未经任何专门训练的情况下下棋,只能在赛前从互联网上获取...
OpenAI 希望 ChatGPT 能够更多地了个人,包括您的电子邮件、Google 日历中的日历事件,甚至您的 Google 联系人,以便在对话中参考所有内容。在新的支持文档更新中,OpenAI 确认将在 ChatGPT (Pro) 中推出对 Gmail、Google 日历和 Googl...
媒体报道,OpenAI及其联合创始人奥特曼(Sam Altman)正准备支持一家与马斯克(Elon Musk)旗下Neuralink竞争的脑机接口公司,让两位科技巨头的竞争进一步升温。这家新公司叫Merge Labs,目前正以8.5亿美元的估值筹集资金。据三名直接了解计划的人士向媒体透露,...
美国时间7月17日,OpenAI终于迎来了它的“Agent时刻”——通用型ChatGPT Agent正式发布。它整合了深度研究工具Deep Research与执行工具Operator,可一站式完成复杂任务,但仍存在速度慢、个性化不足等短板。这款产品的发布,让市场重新审视通用AI代理的技术路...