AI BENCHY
Your ad here

Catégorie AI BENCHY

Classement Suivi des instructions

Voyez quels modèles d'IA réussissent le mieux sur Suivi des instructions, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↓.

Modèles affichés

15

Moyenne de Score Suivi des instructions

8.0

Rang Modèle Entreprise Score Suivi des instructions Score Tests corrects Temps de réponse (moy.)
#39 Seed-2.0-Mini medium Bytedance Seed 10.0 7.5 2/2 17.5s
#40 GPT-5.2 medium OpenAI 9.9 7.5 2/2 3.12s
#41 MiMo-V2-Flash medium Xiaomi 10.0 7.5 2/2 4.28s
#43 Qwen3.5-35B-A3B medium Qwen 10.0 7.4 2/2 24.4s
#46 Kimi K2.5 medium Moonshot AI 10.0 7.0 2/2 92.5s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 10.0 6.8 2/2 1.67s
#50 Hunter Alpha medium OpenRouter 9.9 6.7 2/2 4.18s
#53 GLM 5 none Z.ai 10.0 6.6 2/2 1.48s
#54 Mercury 2 medium Inception 10.0 6.5 2/2 1.07s
#61 Seed-2.0-Lite none Bytedance Seed 10.0 6.2 2/2 1.06s
#64 DeepSeek V3.2 none DeepSeek 10.0 6.1 2/2 1.52s
#68 gpt-oss-120b medium OpenAI 9.9 5.8 2/2 7.63s
#81 Elephant medium Openrouter 9.8 5.2 2/2 987ms
#85 Elephant none Openrouter 9.8 5.2 2/2 1.03s
#11 Gemini 3.1 Flash Lite Preview high Google 7.9 8.4 1/2 70.1s

Meilleurs modèles par Score Suivi des instructions

Score Suivi des instructions vs coût total

Meilleurs modèles par Temps de réponse (moy.)