Catégorie AI BENCHY
Classement Culture générale
Voyez quels modèles d'IA réussissent le mieux sur Culture générale, lesquels restent fiables et où les écarts sont les plus marqués.
Modèles affichés
15
Moyenne de Score Culture générale
2.9
Meilleur modèle
Gemini 3 Flash Preview 10.0Raisons d'échec
| Rang | Modèle | Entreprise | Score Culture générale | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #105 | Qwen3.6 Flash none | Qwen | 3.0 | 5.6 | 0/1 | 649ms |
| #106 | MiniMax M2.5 medium | Minimax | 3.0 | 5.5 | 0/1 | 80.8s |
| #107 | Mistral Small 4 medium | Mistral | 3.0 | 5.5 | 0/1 | 5.92s |
| #110 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.5 | 0/1 | 295ms |
| #112 | Kimi K2.5 none | Moonshot AI | 3.0 | 5.4 | 0/1 | 3.90s |
| #114 | GLM 5 Turbo none | Z.ai | 3.0 | 5.4 | 0/1 | 2.37s |
| #118 | Ling-2.6-flash none | Inclusionai | 3.0 | 5.3 | 0/1 | 1.06s |
| #119 | gpt-oss-120b none | OpenAI | 3.0 | 5.2 | 0/1 | 47.3s |
| #120 | DeepSeek V4 Flash none | DeepSeek | 3.0 | 5.2 | 0/1 | 3.07s |
| #121 | Qwen3 Coder Next none | Qwen | 3.0 | 5.2 | 0/1 | 601ms |
| #122 | Nemotron 3 Super none | NVIDIA | 3.0 | 5.2 | 0/1 | 8.94s |
| #123 | MiniMax M2.7 medium | Minimax | 3.0 | 5.1 | 0/1 | 22.8s |
| #124 | Mistral Small 4 none | Mistral | 3.0 | 5.1 | 0/1 | 397ms |
| #125 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.0 | 0/1 | 1.33s |
| #126 | Qwen3.6 35B A3B none | Qwen | 3.0 | 5.0 | 0/1 | 414ms |