Claude Opus 4.8 是 Anthropic 于2026年5月28日推出的最新旗舰大模型,在多项关键评测中取得突破性成绩。在SWE-bench Pro编程基准测试中,它取得了69.2%的得分,领先GPT-5.5(58.6%)和Gemini 3.1 Pro(54.2%)超过10个百分点;在GDPval-AA智能体能力排行榜上,它以1890 Elo得分位列第一,显著高于GPT-5.5(高出121分)。该模型还展现出极高的“诚实度”,在评估“谎报率”的测试中达到完美的0.00,成为首个在此项获得满分的模型,彻底杜绝了模型“假装知道”的问题。