当前位置:首页 >文章发布 > 正文
Anthropic发布全球首个双思维模型,代码能力超过DeepSeek、o3
来源:ENI经济和信息化网 作者:
ENI
2025-02-25 08:39:21
2月25日,Anthropic祭出首个混合推理Claude 3.7 Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击o3-mini、DeepSeek R1,AI编码王者出世了。
2月25日,Anthropic公司发布了首个混合推理模型Claude 3.7 Sonnet。这款模型的表现超越了o3-mini和DeepSeek R1,成为AI编码领域的新王者。该模型不仅在数学、物理、指令执行、编程等多个领域刷新了SOTA记录,相较于上一代Claude 3.5 Sonnet,其数学和编码能力更是暴涨10%以上。此外,Claude 3.7 Sonnet还提供了“扩展思考”模式,尽管目前尚未全面上线,但已经吸引了大量用户的关注。用户可以通过API精细控制模型的思考时间,从而在速度、成本与回答质量之间进行权衡。
与此同时,Anthropic还推出了首款“智能体编程”工具Claude Code(预览版)。这款工具已经成为Anthropic内部不可或缺的一部分,在早期测试中表现出色,能够一次性完成通常需要人类45分钟以上的任务。Claude Code能够搜索和阅读代码、编辑文件、编写和运行测试、提交并将代码推送至GitHub,同时确保用户在每一步都能参与其中。此外,Claude 3.7 Sonnet还具备“行为扩展”特性,能够迭代调用函数、响应环境变化,并持续操作直到完成开放式任务。
CIO智行社 |
数智化峰会
宋晶中航工业西安飞行自动控制研...
韦刚林奥科宁克IT负责人