Catégorie AI BENCHY
Classement Résolution d'énigmes
Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués.
Modèles affichés
15
Moyenne de Score Résolution d'énigmes
6.7
Meilleur modèle
Gemini 3 Flash Preview 10.0| Rang | Modèle | Entreprise | Score Résolution d'énigmes | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #117 | Qwen3.5-35B-A3B none | Qwen | 3.7 | 5.6 | 0/3 | 1.35s |
| #119 | Cobuddy medium | Baidu | 3.6 | 5.6 | 0/3 | 12.8s |
| #151 | Trinity Large Preview none | Arcee AI | 3.6 | 4.6 | 0/3 | 1.97s |
| #128 | Qwen3.6 Flash none | Qwen | 3.5 | 5.4 | 0/3 | 1.21s |
| #147 | GPT-4o-mini none | OpenAI | 3.5 | 4.8 | 0/3 | 1.21s |
| #132 | Mistral Small 4 medium | Mistral | 3.4 | 5.3 | 0/3 | 2.17s |
| #153 | Qwen3.6 35B A3B none | Qwen | 3.2 | 4.6 | 0/3 | 1.07s |
| #154 | Qwen3.5-9B none | Qwen | 3.2 | 4.6 | 0/3 | 621ms |
| #163 | Granite 4.1 8B none | IBM Granite | 3.2 | 4.0 | 0/3 | 608ms |
| #124 | Kimi K2.6 none | Moonshot AI | 3.1 | 5.5 | 0/3 | 1.40s |
| #142 | Mistral Small 4 none | Mistral | 3.1 | 4.9 | 0/3 | 399ms |
| #108 | Qwen3.5-Flash none | Qwen | 3.1 | 5.8 | 0/3 | 10.9s |
| #155 | Mercury 2 none | Inception | 3.1 | 4.5 | 0/3 | 535ms |
| #156 | Hy3 preview none | Tencent | 3.1 | 4.4 | 0/3 | 4.56s |
| #159 | Ling-2.6-1T none | Inclusionai | 3.1 | 4.3 | 0/3 | 5.36s |