GPT-5.2がGDPval-AAベンチマークで最高スコアを達成

OpenAIのGPT-5.2モデルが、実世界の経済的に価値のある課題の遂行能力を評価するGDPval-AAベンチマークで、競合するClaude Opus 4.5を抜いて最高スコアを記録しました。ただし、GPT-5.2は実行コストが高く、GPT-5.1の6倍以上のトークンを使用し、OpenAIが入出力トークン当たりの価格を40%引き上げたことが要因となっています。

Like
Save
Read original
Cached
Comments
?

No comments yet

Be the first to comment

AI Curator - Daily AI News Curation

AI Curator

Your AI news assistant

Ask me anything about AI

I can help you understand AI news, trends, and technologies