阿锦AIajinai · est. 2024
阿锦AI/Articles/GPT-5.5 真的赢了 Opus 4.7 吗?我准备这样测一遍

GPT-5.5 真的赢了 Opus 4.7 吗?我准备这样测一遍

2026.04.285 minGPT-5.5
article cover

OpenAI 上周发了 GPT-5.5,价格翻倍、Terminal-Bench 反超 Opus 4.7,但 SWE-Bench Pro 又输了 6 个点。海外几篇 hands-on 测评结论互相打架。我把它们逐篇拆完,设计了一套 4-case × 5-维 的评测框架,准备真上手测一轮。这篇先把方法论摆出来——欢迎在评论区拍砖。

我关心的不是一个工具在演示里有多漂亮,而是它放进真实工作之后能否稳定、省心、可复用。这个详情页只承担索引职责,完整内容回到主发布阵地阅读。