AI BENCHY カテゴリ
複合 ランキング
複合 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↑.
| 順位 | モデル | 企業 | 複合 スコア | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #54 | GPT-5 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 88.2s |
| #36 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 10.0 | 7.6 | 1/1 | 92.4s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 10.0 | 7.0 | 1/1 | 93.1s |
| #29 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 7.8 | 1/1 | 107.8s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 4.5 | 5.0 | 0/1 | 112.0s |
| #82 | Hy3 preview high | Tencent | 10.0 | 6.6 | 1/1 | 113.1s |
| #133 | DeepSeek V3.2 none | DeepSeek | 6.5 | 5.2 | 0/1 | 115.9s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 121.5s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 1/1 | 149.2s | |
| #30 | Qwen3.5-27B medium | Qwen | 10.0 | 7.8 | 1/1 | 164.0s |
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 6.9 | 1/1 | 262.8s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 1/1 | 280.5s | |
| #75 | Ring-2.6-1T medium | Inclusionai | 10.0 | 6.9 | 1/1 | 304.2s |