AI BENCHY
Advertise here

Catégorie AI BENCHY

Classement Résolution d'énigmes

Voyez quels modèles d'IA réussissent le mieux sur Résolution d'énigmes, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↓.

Modèles affichés

15

Moyenne de Score Résolution d'énigmes

6.7

Rang Modèle Entreprise Score Résolution d'énigmes Score Tests corrects Temps de réponse (moy.)
#69 Claude Opus 4.6 medium Anthropic 7.7 7.0 2/3 4.71s
#73 Seed-2.0-Mini medium Bytedance Seed 8.2 6.9 2/3 31.8s
#77 Claude Sonnet 4.6 none Anthropic 7.7 6.8 2/3 2.53s
#78 Qwen3.6 27B medium Qwen 7.7 6.8 2/3 61.1s
#82 Hy3 preview high Tencent 7.7 6.6 2/3 27.9s
#88 Qwen3.7 Plus none Qwen 7.7 6.4 2/3 1.71s
#91 GPT-5.5 none OpenAI 7.7 6.4 2/3 1.29s
#95 Qwen3.5 Plus 2026-02-15 none Qwen 7.7 6.3 2/3 2.71s
#96 Ring-2.6-1T none Inclusionai 7.7 6.2 2/3 31.5s
#97 Gemini 2.5 Flash none Google 7.7 6.2 2/3 604ms
#98 GLM 5 none Z.ai 7.7 6.1 2/3 1.91s
#106 Grok 4.20 Beta none X AI 7.7 5.8 2/3 586ms
#112 GLM 5.1 none Z.ai 7.7 5.7 2/3 1.45s
#113 DeepSeek V4 Pro none DeepSeek 7.6 5.7 2/3 16.0s
#133 DeepSeek V3.2 none DeepSeek 7.6 5.2 2/3 6.91s

Meilleurs modèles par Score Résolution d'énigmes

Score Résolution d'énigmes vs coût total

Meilleurs modèles par Temps de réponse (moy.)