AI BENCHY カテゴリ
汎用知能 ランキング
汎用知能 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。
| 順位 | モデル | 企業 | 汎用知能 スコア | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #56 | MiMo-V2.5 medium | Xiaomi | 5.4 | 7.3 | 0/1 | 5.37s |
| #80 | Mimo V2 Omni medium | Xiaomi | 5.4 | 6.7 | 0/1 | 3.61s |
| #124 | Kimi K2.6 none | Moonshot AI | 5.4 | 5.5 | 0/1 | 1.55s |
| #88 | Qwen3.7 Plus none | Qwen | 5.3 | 6.4 | 0/1 | 1.33s |
| #118 | Qwen3.6 27B none | Qwen | 5.2 | 5.6 | 0/1 | 1.07s |
| #67 | MiniMax M3 medium | Minimax | 5.1 | 7.1 | 0/1 | 33.3s |
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 5.1 | 6.9 | 0/1 | 36.7s |
| #26 | Qwen3.6 Plus medium | Qwen | 5.1 | 7.9 | 0/1 | 27.1s |
| #53 | Gemini 3.1 Flash Lite high | 5.0 | 7.3 | 0/1 | 45.7s | |
| #97 | Gemini 2.5 Flash none | 5.0 | 6.2 | 0/1 | 615ms | |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 5.0 | 6.0 | 0/1 | 13.5s |
| #106 | Grok 4.20 Beta none | X AI | 5.0 | 5.8 | 0/1 | 541ms |
| #112 | GLM 5.1 none | Z.ai | 5.0 | 5.7 | 0/1 | 790ms |
| #115 | Qwen3.5-27B none | Qwen | 5.0 | 5.7 | 0/1 | 2.51s |
| #131 | Qwen3.5-122B-A10B none | Qwen | 5.0 | 5.3 | 0/1 | 1.12s |