Catégorie AI BENCHY
Classement Spécifique au domaine
Voyez quels modèles d'IA réussissent le mieux sur Spécifique au domaine, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↑.
Modèles affichés
15
Moyenne de Score Spécifique au domaine
4.8
Meilleur modèle
Qwen3.6 Max Preview 2.9| Rang | Modèle | Entreprise | Score Spécifique au domaine | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #14 | Qwen3.6 Max Preview medium | Qwen | 2.9 | 8.5 | 0/3 | 95.9s |
| #17 | GLM 5 medium | Z.ai | 3.5 | 8.3 | 0/3 | 0ms |
| #18 | Qwen3.7 Plus medium | Qwen | 3.6 | 8.2 | 0/3 | 45.3s |
| #23 | GLM 5 Turbo medium | Z.ai | 2.9 | 8.0 | 0/3 | 71.1s |
| #26 | Qwen3.6 Plus medium | Qwen | 2.9 | 7.9 | 0/3 | 29.6s |
| #29 | Qwen3.5-122B-A10B medium | Qwen | 2.9 | 7.8 | 0/3 | 63.4s |
| #31 | DeepSeek V4 Flash high | DeepSeek | 4.1 | 7.7 | 0/3 | 100.3s |
| #36 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 2.9 | 7.6 | 0/3 | 53.1s |
| #37 | Gemma 4 26B A4B medium | 2.9 | 7.6 | 0/3 | 23.6s | |
| #39 | Qwen3.6 Flash medium | Qwen | 3.5 | 7.5 | 0/3 | 14.6s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 3.0 | 7.5 | 0/3 | 4.21s | |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 3.5 | 7.5 | 0/3 | 24.9s |
| #44 | Gemini 3.1 Flash Lite medium | 2.9 | 7.5 | 0/3 | 3.16s | |
| #45 | GPT-5.4 Mini medium | OpenAI | 4.1 | 7.5 | 0/3 | 65.3s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 2.9 | 7.4 | 0/3 | 0ms |