行业热点

Anthropic 测试 Claude Sonnet 4.5,称其为“领先全球的编码模型”

发布日期:2025-10-08 20:24
Chain Icon
欧易OKX
OKX是全球十大虚拟货币交易所之一,支持90多个国家地区的法币充值服务,是法币入场和提现的重要通道之一。

在周一发布的消息中,谷歌宣布推出了全球最佳编码模型,名为克劳德·桑奈特 4.5。该公司还发布了一套新的开发工具,旨在帮助开发者更好地完成复杂、多步骤的编码任务。据称,这个模型可以处理超过30小时的编码任务,并在推理和数学能力方面取得了显著提升。

Anthropic 测试 Claude Sonnet 4.5,称其为“领先全球的编码模型”

根据 Anthropic 的公告,该模型在 SWE-bench Verified(一项衡量真实世界软件编码能力的基准测试)上的得分为 77.2%。使用并行测试时计算时,该得分可提升至 82%。这使得新模型领先于 OpenAI 和谷歌的最佳产品,甚至超过了 Anthropic 的 Claude 4.1 Opus(根据该公司的命名方案,Haiku 为小型模型,Sonnet 为中型模型,而 Opus 是该系列中最重、性能最强的模型)。

Anthropic 测试 Claude Sonnet 4.5,称其为“领先全球的编码模型”
Chain Icon
欧易OKX
OKX是全球十大虚拟货币交易所之一,支持90多个国家地区的法币充值服务,是法币入场和提现的重要通道之一。
分享到: