GPT-5.2がGDPval-AAベンチマークで最高スコアを達成
OpenAIのGPT-5.2モデルが、実世界の経済的に価値のある課題の遂行能力を評価するGDPval-AAベンチマークで、競合するClaude Opus 4.5を抜いて最高スコアを記録しました。ただし、GPT-5.2は実行コストが高く、GPT-5.1の6倍以上のトークンを使用し、OpenAIが入出力トークン当たりの価格を40%引き上げたことが要因となっています。
Like
Save
Cached
Comments
No comments yet
Be the first to comment