GPT-5.2がLiveBenchとLMArenaで敗北
OpenAIのRedditに投稿された記事によると、同社の最新言語モデルGPT-5.2がベンチマークテストのLiveBenchとLMArenaで敗北したことが明らかになりました。これらのテストは言語モデルの性能を評価するものであり、GPT-5.2の結果は同社にとって大きな打撃となっています。詳細な原因や今後の対応については言及されていませんが、OpenAIは今後の改善に向けて取り組む必要があるでしょう。
Like
Save
Cached
Comments
No comments yet
Be the first to comment