OpenAI o3、人間超越を達成 – ARC-AGIで87.5%の衝撃スコア

OpenAI o3、人間超越を達成 – ARC-AGIで87.5%の衝撃スコア

OpenAI o3 AI Brain

TL;DR

– OpenAI o3がARC-AGI視覚推論で人間初超越87.5%
– 数学AIME 96.7%、コーディングELO 2727達成
– プログラム合成技術でAGI実現へ大きく前進

背景

2024年12月発表のOpenAI o3は、推論特化型AIとして従来の限界を突破。特にARC-AGI(視覚推論)ベンチマークで初めて人間を上回る性能を実現し、汎用人工知能(AGI)への重要な里程標となった。

詳細

画期的な性能向上

  • ARC-AGI:87.5%(Claude 3.5の53%から大幅向上)
  • 数学AIME:96.7%(o1の74.3%から向上)
  • SWE-Bench:71.7%(ソフトウェア工学で20%向上)

技術革新

「プログラム合成」機能により、事前学習で習得したパターンを動的に組み合わせ、複数解法を評価する高度推論を実現。

今後の展望

o3の成功により、AIの推論能力が人間レベルに到達開始。2025年はAGI実現に向けた決定的な転換点となる可能性が高い。

参考リンク