AI BENCHY カテゴリ
コーディング ランキング
コーディング でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 正解テスト ↓.
| 順位 | モデル | 企業 | コーディング スコア | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #83 | DeepSeek V4 Pro high | DeepSeek | 2.8 | 6.6 | 0/2 | 51.8s |
| #88 | Grok 4.1 Fast medium | X AI | 2.3 | 6.5 | 0/1 | 23.6s |
| #89 | Qwen3.5 Plus 2026-02-15 none | Qwen | 4.9 | 6.4 | 0/2 | 2.54s |
| #91 | GLM 5 none | Z.ai | 4.6 | 6.3 | 0/2 | 5.18s |
| #92 | Gemma 4 26B A4B none | 4.1 | 6.2 | 0/2 | 3.83s | |
| #93 | MiMo-V2-Omni none | Xiaomi | 5.1 | 6.2 | 0/2 | 2.75s |
| #94 | GPT-5 Nano medium | OpenAI | 5.4 | 6.1 | 0/2 | 47.8s |
| #95 | DeepSeek V4 Pro none | DeepSeek | 5.4 | 6.0 | 0/2 | 8.27s |
| #96 | Nemotron 3 Super medium | NVIDIA | 3.1 | 5.9 | 0/2 | 62.4s |
| #97 | gpt-oss-120b medium | OpenAI | 3.9 | 5.9 | 0/2 | 47.2s |
| #102 | GLM 5.1 none | Z.ai | 4.3 | 5.8 | 0/2 | 6.33s |
| #103 | Qwen3.5 Plus 2026-04-20 none | Qwen | 4.4 | 5.8 | 0/2 | 2.08s |
| #105 | Grok 4.20 Beta none | X AI | 5.5 | 5.8 | 0/1 | 1.14s |
| #108 | Cobuddy medium | Baidu | 4.1 | 5.8 | 0/2 | 79.2s |
| #109 | DeepSeek V3.2 none | DeepSeek | 3.1 | 5.7 | 0/2 | 20.9s |