谷歌新款 Gemini Pro 再刷基准纪录

IT业界来源：TechCrunch 作者：Lucky

2026-02-20 09:00:13

谷歌在周四发布了其强大大模型 Gemini Pro 的最新版本 3.1，并表示目前以预览版形式提供，未来将很快正式发布。Q8d系统之家

外界普遍认为，Gemini 3.1 Pro 相比前代 Gemini 3 有明显跃升；后者在去年 11 月发布时已被视为高度成熟的 AI 工具。Q8d系统之家

谷歌还公布了多项独立基准测试的数据，例如 Humanity’s Last Exam，结果显示 3.1 版本显著优于上一代。Q8d系统之家

AI 初创公司 Mercor 的 CEO Brendan Foody 也在社交媒体上称赞该模型，表示其在公司用于评估真实专业任务表现的 APEX-Agents 榜单上位居第一，并指出这体现了智能体在知识工作上的快速进步。Q8d系统之家

此次发布正值大模型竞争升温之际，科技公司持续推出面向智能体任务与多步推理的更强模型，包括 OpenAI 和 Anthropic 在内的主要玩家近期也发布了新版本。Q8d系统之家