Catégorie AI BENCHY
Classement Combiné
Voyez quels modèles d'IA réussissent le mieux sur Combiné, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↓.
| Rang | Modèle | Entreprise | Score Combiné | Score | Tests corrects | Temps de réponse (moy.) |
|---|---|---|---|---|---|---|
| #89 | Hy3 preview low | Tencent | 10.0 | 6.4 | 1/1 | 78.7s |
| #69 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.0 | 1/1 | 76.7s |
| #31 | DeepSeek V4 Flash high | DeepSeek | 10.0 | 7.7 | 1/1 | 76.6s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 9.8 | 7.2 | 1/1 | 75.7s |
| #66 | Qwen3.5-35B-A3B medium | Qwen | 4.7 | 7.1 | 0/1 | 75.3s |
| #37 | Gemma 4 26B A4B medium | 9.6 | 7.6 | 1/1 | 73.5s | |
| #76 | Kimi K2.5 medium | Moonshot AI | 10.0 | 6.8 | 1/1 | 71.4s |
| #94 | GPT-5 Nano medium | OpenAI | 10.0 | 6.3 | 1/1 | 66.0s |
| #158 | GLM 4.7 Flash medium | Z.ai | 2.8 | 4.4 | 0/1 | 65.6s |
| #67 | MiniMax M3 medium | Minimax | 10.0 | 7.1 | 1/1 | 65.3s |
| #18 | Qwen3.7 Plus medium | Qwen | 10.0 | 8.2 | 1/1 | 65.2s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 10.0 | 6.0 | 1/1 | 65.0s |
| #51 | Mimo V2 PRO medium | Xiaomi | 4.7 | 7.4 | 0/1 | 64.7s |
| #38 | Grok 4.3 medium | X AI | 10.0 | 7.6 | 1/1 | 64.0s |
| #129 | MiniMax M2.5 medium | Minimax | 4.5 | 5.3 | 0/1 | 60.4s |