谷歌新款 Gemini Pro 再刷基准纪录
谷歌在周四发布了其强大大模型 Gemini Pro 的最新版本 3.1,并表示目前以预览版形式提供,未来将很快正式发布。
外界普遍认为,Gemini 3.1 Pro 相比前代 Gemini 3 有明显跃升;后者在去年 11 月发布时已被视为高度成熟的 AI 工具。
谷歌还公布了多项独立基准测试的数据,例如 Humanity’s Last Exam,结果显示 3.1 版本显著优于上一代。
AI 初创公司 Mercor 的 CEO Brendan Foody 也在社交媒体上称赞该模型,表示其在公司用于评估真实专业任务表现的 APEX-Agents 榜单上位居第一,并指出这体现了智能体在知识工作上的快速进步。
此次发布正值大模型竞争升温之际,科技公司持续推出面向智能体任务与多步推理的更强模型,包括 OpenAI 和 Anthropic 在内的主要玩家近期也发布了新版本。















京公网安备 11010502041132号