Catégorie AI BENCHY
Classement Résolution d'énigmes
Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués.
Modèles affichés
12
Moyenne de Score Résolution d'énigmes
6.7
Meilleur modèle
Gemini 3 Flash Preview 10.0| Rang | Modèle | Entreprise | Score Résolution d'énigmes | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #139 | DeepSeek V4 Flash none | DeepSeek | 3.1 | 5.0 | 0/3 | 23.7s |
| #105 | Nemotron 3 Super medium | NVIDIA | 3.0 | 5.8 | 0/3 | 3.15s |
| #135 | Kimi K2.5 none | Moonshot AI | 3.0 | 5.2 | 0/3 | 4.04s |
| #140 | Qwen3 Coder Next none | Qwen | 3.0 | 4.9 | 0/3 | 24.3s |
| #145 | Laguna M.1 none | Poolside | 3.0 | 4.8 | 0/3 | 891ms |
| #150 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.6 | 0/3 | 1.25s |
| #157 | Grok 4.1 Fast none | X AI | 3.0 | 4.4 | 0/3 | 1.10s |
| #161 | Qwen3.5-9B medium | Qwen | 3.0 | 4.2 | 0/3 | 32.3s |
| #162 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 3.0 | 4.1 | 0/3 | 532ms |
| #138 | Ling-2.6-flash none | Inclusionai | 2.9 | 5.0 | 0/3 | 6.51s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 2.9 | 4.6 | 0/3 | 1.40s |
| #158 | GLM 4.7 Flash medium | Z.ai | 2.9 | 4.4 | 0/3 | 12.9s |