可让照片人物“开口说话”,阿里巴巴研究团队推出 AI 框架“EMO”
3 月 1 日消息,阿里巴巴研究团队近日发布了一款名为“EMO(Emote Portrait Alive)”的 AI 框架,该框架号称可以用于“对口型”,只需要输入人物照片及音频,模型就能够让照片中的人物开口说出相关音频,支持中英韩等语言。
你的专属IT资讯
3 月 1 日消息,阿里巴巴研究团队近日发布了一款名为“EMO(Emote Portrait Alive)”的 AI 框架,该框架号称可以用于“对口型”,只需要输入人物照片及音频,模型就能够让照片中的人物开口说出相关音频,支持中英韩等语言。
3 月 1 日消息,微软公司今天发布新闻稿,宣布扩充 Windows 11 系统中的 Copilot 预览版技能,并在聊天过程中支持同时启用 3 款插件。
2023年毫无疑问是AI应用爆发的一年,ChatGPT、Gemini、Llama、Stable Diffusion、文心一言等大模型震撼了无数人。与此同时,“AI将威胁人类工作机会”的言论越来越流行。
2月29日消息,苹果CEO库克在今天的股东大会上表示,公司认为“生成式人工智能具有令人难以置信的突破潜力”,这也是为什么公司正在这个领域进行重大投资。
“Ameca,最近怎么样?”“嗯……就勉强活着吧。”——英国机器人公司Engineered Arts最新视频中,“当家花旦”人形机器人Ameca以这样一个回答开场后,展示了一番视觉感知能力与声音克隆能力。
当地时间周一(2月26日),2024年世界移动通信大会(MWC 2024)在西班牙巴塞罗那拉开帷幕。当天在MWC上,英伟达主导的“AI-RAN联盟”宣布正式成立。据了解,AI-RAN指“人工智能(AI)-无线接入网(RAN)”,是一个旨在重振人工智能与无线通信融合、引领技术创新的行业协会组织,使命是提高移动网络效率、降低功耗并改造现有基础设施,为在5G和6G的推动下利用AI释放新的经济机会奠定基础。
考虑到人工智能在几乎所有现代智能手机上都已变得司空见惯,高通公司(Qualcomm)正在采取主动姿态,该公司刚刚发布了人工智能中心(AI Hub)。它将帮助开发人员在其应用程序中快速实现人工智能和生成式人工智能功能,而无需处理太多复杂的问题。
在微软投资并与法国大语言模型初创公司 Mistral AI 建立合作伙伴关系之后,该公司声明继续努力试图通过与 OpenAI 的深度合作(和资金入股)来消除其阻碍竞争的形象。今天,该公司推出了一个名为”AI 准入原则”的新框架–微软表示,这十一点计划将”指导我们如何在全球运营我们的 AI 数据中心基础设施和其他重要的 AI 资产”。
北京时间周一深夜,创业未满一年已成欧洲人工智能龙头的Mistral AI连发数条消息——发布最新大模型Mistral Large、推出首个聊天机器人产品Le Chat,以及与微软达成更加深入的合作协议。
如果说去年是 AI 元年,那今年就是 AI 硬件的元年。从 AI Pin 、 Rabbit R1 这些小的 AI 硬件,到 PC 厂商所强调的 AI PC ,再到眼下非常火的 AI 手机。浪潮滚滚,仿佛一个 “AI Everything” 的时代正向我们迎面拍来。