Catégorie AI BENCHY
Classement Spécifique au domaine
Voyez quels modèles d'IA réussissent le mieux sur Spécifique au domaine, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.
| Rang | Modèle | Entreprise | Score Spécifique au domaine | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #11 | Claude Opus 4.7 medium | Anthropic | 7.7 | 8.7 | 2/3 | 1.17s |
| #95 | Qwen3.5 Plus 2026-02-15 none | Qwen | 5.3 | 6.3 | 1/3 | 1.17s |
| #128 | Qwen3.6 Flash none | Qwen | 5.3 | 5.4 | 1/3 | 1.11s |
| #125 | GPT-5.4 none | OpenAI | 5.3 | 5.5 | 1/3 | 1.07s |
| #157 | Grok 4.1 Fast none | X AI | 5.9 | 4.4 | 1/3 | 1.06s |
| #159 | Ling-2.6-1T none | Inclusionai | 3.0 | 4.3 | 0/3 | 1.04s |
| #87 | Gemini 3.1 Flash Lite minimal | 2.9 | 6.4 | 0/3 | 1.02s | |
| #34 | Qwen3.7 Max none | Qwen | 7.7 | 7.7 | 2/3 | 975ms |
| #48 | Gemini 3 Flash Preview none | 7.7 | 7.4 | 2/3 | 963ms | |
| #140 | Qwen3 Coder Next none | Qwen | 5.3 | 4.9 | 1/3 | 962ms |
| #58 | Gemini 3.1 Flash Lite Preview none | 5.3 | 7.2 | 1/3 | 942ms | |
| #144 | GPT-5.4 Mini none | OpenAI | 3.5 | 4.9 | 0/3 | 937ms |
| #137 | Elephant Alpha none | Openrouter | 3.0 | 5.1 | 0/3 | 927ms |
| #148 | GPT-5.4 Nano none | OpenAI | 2.9 | 4.7 | 0/3 | 926ms |
| #136 | Elephant Alpha medium | Openrouter | 3.0 | 5.1 | 0/3 | 925ms |