AI BENCHY カテゴリ
汎用知能 ランキング
汎用知能 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。
| 順位 | モデル | 企業 | 汎用知能 スコア | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #63 | GPT-5.3 Chat none | OpenAI | 4.6 | 7.2 | 0/1 | 1.99s |
| #109 | GLM 5V Turbo none | Z.ai | 4.6 | 5.8 | 0/1 | 2.22s |
| #141 | Nemotron 3 Super none | NVIDIA | 4.6 | 4.9 | 0/1 | 950ms |
| #152 | MiMo-V2-Flash none | Xiaomi | 4.6 | 4.6 | 0/1 | 1.67s |
| #45 | GPT-5.4 Mini medium | OpenAI | 4.5 | 7.5 | 0/1 | 3.72s |
| #54 | GPT-5 Mini medium | OpenAI | 4.5 | 7.3 | 0/1 | 13.5s |
| #70 | GPT-5.4 Nano medium | OpenAI | 4.5 | 7.0 | 0/1 | 4.15s |
| #151 | Trinity Large Preview none | Arcee AI | 4.5 | 4.6 | 0/1 | 873ms |
| #46 | Qwen3.6 35B A3B medium | Qwen | 4.4 | 7.4 | 0/1 | 8.66s |
| #47 | Grok Build 0.1 medium | X AI | 4.4 | 7.4 | 0/1 | 18.4s |
| #125 | GPT-5.4 none | OpenAI | 4.4 | 5.5 | 0/1 | 1.78s |
| #143 | MiMo-V2.5 none | Xiaomi | 4.4 | 4.9 | 0/1 | 6.86s |
| #154 | Qwen3.5-9B none | Qwen | 4.4 | 4.6 | 0/1 | 552ms |
| #157 | Grok 4.1 Fast none | X AI | 4.4 | 4.4 | 0/1 | 1.08s |
| #24 | GPT-5.2 Chat none | OpenAI | 4.4 | 7.9 | 0/1 | 3.20s |