2件の記事
2026年3月5日にリリースされたGPT-5.4は、デスクトップ操作の成功率75.0%で人間(72.4%)を超過。コーディングベンチマークSWE-bench Proでは57.7%と競合を大差でリードする。一方、推論コスト9分の1のDeepSeek V3.2が市場に登場し「最強モデル」の定義がユースケース依存に移行。SoftBank-OpenAI合弁「SB OAI Japan」が日本市場展開を本格化する中、企業の「モデル選択疲れ」という新たなリスクも生まれている。
GPT-5.4・Claude Opus 4.6・Gemini 3.1 Pro・Muse Sparkが同じ土俵で競い合う2026年。ベンチマークの優劣だけでなく「誰に届けるか」という配布力と、規制対応の安全性ブランドが勝敗を左右する。本稿は4社の戦略・ビジネスモデル・日本市場での温度差・オープン/クローズドを選ぶ本当の理由を独自の視点で整理し、5年後の生存者を問う。