个性化AI是否会成为新的MBTI?
近期我订阅了Gemini Advanced,借此机会深入探索了Gemini的各项能力。其中“个性化”(Personalization)功能特别引起了我的注意,官方描述为“基于搜索历史提供定制化帮助”。 简言之,Google会利用我的浏览记录来优化回答内容。 作为一位使用Google产品超过...
你的专属IT资讯(IT News)
近期我订阅了Gemini Advanced,借此机会深入探索了Gemini的各项能力。其中“个性化”(Personalization)功能特别引起了我的注意,官方描述为“基于搜索历史提供定制化帮助”。 简言之,Google会利用我的浏览记录来优化回答内容。 作为一位使用Google产品超过...
都2025了,没想到: 诶?智能眼镜还没凉透(bushi),甚至又行了! 新年开始,科技圈就疯传:2025年将成为AI眼镜元年,“百镜大战”一触即发! 但是这次不是噱头啊、PPT、流量博主来博眼球的,而是市场上真有大动作。 首先是年初在美国拉斯维加斯举办的CES展(国际消费电子展),据不完...
德州大学用Transformer训练宝可梦AI跻身全球前10% 还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没用启发式算法,纯靠47.5万场人类对战回放训练出来,居然打上了Pok...
OpenAI推进AGI至智能体阶段,发布编程智能体,资本与算力成关键。 OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agent)。除Operator和深度研究Deep Research智能体外,OpenAI即将发布全球最强...
OpenAI 的 o3 AI 模型的第一方和第三方基准测试结果之间的差异引发了人们对该公司透明度和模型测试实践的质疑。OpenAI于 12 月发布 o3时,声称该模型能够解答 FrontierMath(一组颇具挑战性的数学问题)中略高于四分之一的题目。这一成绩远远超出了竞争对手——排名第二...
o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。 满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据P...
OpenAI近期推出的 o3 和 o4-mini AI 模型在很多方面都达到了领先水平。然而,这些新模型仍然会产生幻觉,或者说,会虚构事物——事实上,它们比 OpenAI 的几个老模型更容易产生幻觉。 幻觉已被证明是人工智能领域最难解决的问题之一,甚至会影响到当今性能最佳的系统。从历史上看...
4月19日,The Information发文,在过去一年的大部分时间里,Meta一直在试图让其他科技巨头为其Llama AI模型提供资金。这反映出,尽管AI技术的潜在回报仍不确定,但相关支出却在不断增加。 AI数据中心 科技巨头们财力雄厚,但AI相关支出正在掏空它们的资金。Meta去年从...
AI圈最近弥漫着一股微妙的气息。人们似乎不再热议大语言模型的最新突破、以及AI应用的无限可能时,一些代表着未来的AI巨头,却似乎正将目光投向互联网那熟悉得不能再熟悉的角落——社交网络与社区。 近期的传闻和动作颇具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,据称正内...
紧跟o4-mini,谷歌上新了Gemini 2.5 Flash preview版本。 作为更注重效率的Flash,在大模型竞技场上排名并列第二,第一是自家的Gemini 2.5 Pro。 这样的表现,让Gemini 2.5 Flash的性价比直接拉满。 而且还是一款混合推理模型,可以自由设...