Catégorie AI BENCHY
Classement Intelligence générale
Voyez quels modèles d'IA réussissent le mieux sur Intelligence générale, lesquels restent fiables et où les écarts sont les plus marqués.
Modèles affichés
15
Moyenne de Score Intelligence générale
6.1
Meilleur modèle
Gemini 3 Flash Preview 10.0| Rang | Modèle | Entreprise | Score Intelligence générale | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #33 | GLM 5.1 medium | Z.ai | 10.0 | 7.8 | 1/1 | 20.9s |
| #34 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.7 | 1/1 | 17.8s |
| #35 | MiMo-V2-Omni medium | Xiaomi | 10.0 | 7.7 | 1/1 | 2.86s |
| #37 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.6 | 1/1 | 5.04s |
| #48 | Gemma 4 31B none | 10.0 | 6.9 | 1/1 | 2.09s | |
| #53 | GLM 5 none | Z.ai | 10.0 | 6.6 | 1/1 | 3.27s |
| #59 | Qwen3.5-Flash none | Qwen | 10.0 | 6.2 | 1/1 | 803ms |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 10.0 | 6.2 | 1/1 | 3.45s |
| #64 | DeepSeek V3.2 none | DeepSeek | 10.0 | 6.1 | 1/1 | 2.86s |
| #76 | Kimi K2.5 none | Moonshot AI | 10.0 | 5.5 | 1/1 | 4.00s |
| #87 | Qwen3 Coder Next none | Qwen | 10.0 | 5.1 | 1/1 | 1.34s |
| #50 | Hunter Alpha medium | OpenRouter | 7.0 | 6.7 | 0/1 | 6.44s |
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 6.7 | 8.6 | 0/1 | 18.2s |
| #46 | Kimi K2.5 medium | Moonshot AI | 6.5 | 7.0 | 0/1 | 69.7s |
| #63 | Qwen3.5-35B-A3B none | Qwen | 6.5 | 6.1 | 0/1 | 1.19s |