导语 谷歌抢先发布 Gemini Deep Research 智能体,主打深度研究与第三方 API 嵌入,意在定义“代理式 AI”时代。然而 OpenAI 紧随其后发布 GPT-5.2 并宣称全面超越,两大巨头在 AI 代理赛道的角力进入白热化阶段。
深度研究代理 解决幻觉难题
就在 OpenAI 发布代号“Garlic”的新模型前夕,谷歌抢先一步推出了 Gemini Deep Research。这款基于最新 Gemini 3 Pro 大模型构建的智能体,专为处理海量信息与超长上下文提示而设计。
该工具能高效整合庞杂数据流,适用于尽职调查、药物安全评估等高要求场景。为应对“幻觉”问题,Gemini 3 Pro 特别优化了事实准确性,确保在多步骤自主决策链条中的可靠性。更关键的是,它首次通过 Interactions API 向开发者开放,允许将谷歌的高级研究能力嵌入第三方应用。

激烈的基准测试攻防战
为了验证技术优势,谷歌推出了 DeepSearchQA 新基准测试,并在“人类终极考试”中表现优异。然而,讽刺的是,这些数据发布当天即遭遇挑战。
OpenAI 紧随其后正式推出了 GPT-5.2,宣称在包括自家基准和浏览器自动化任务(BrowserComp)在内的多项测试中全面超越竞品。这场发布时点的精准卡位,凸显了双方在代理智能赛道上的激烈角力:一方主打深度研究,另一方强调通用推理,真正的 AI 代理战争才刚刚开始。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译






评论 (0)
暂无评论,快来发表第一条评论吧!