2 月 18 日消息,Anthropic 发布了其中等规模 Sonnet 模型的新版本,延续了公司每四个月更新一次的节奏。在宣布新模型的公告中,Anthropic 重点强调了其在代码能力、指令遵循与计算机操作方面的改进。
Sonnet 4.6 将成为免费版与 Pro 版用户的默认模型。
本次推出的 Sonnet 4.6 测试版将支持 100 万 token 的上下文窗口,是此前 Sonnet 最大窗口的两倍。Anthropic 表示,新的上下文窗口“单次请求即可容纳完整代码库、长篇合同或数十篇研究论文”。
此次发布距离 Opus 4.6 推出仅两周时间,新版 Haiku 模型预计也将在未来几周内跟进。
注意到,该模型在多项基准测试中创下新高,包括用于评估计算机操作能力的 OS World、用于软件工程的 SWE‑Bench。而最亮眼的成绩,是其在衡量类人智能的 ARC‑AGI‑2 测试中达到 60.4%。这一分数让 Sonnet 4.6 超越了绝大多数同级别模型,不过仍落后于 Opus 4.6、Gemini 3 Deep Think 以及某一精调版 GPT 5.2 等旗舰模型。
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!