AI BENCHY
Your ad here

Catégorie AI BENCHY

Classement Suivi des instructions

Voyez quels modèles d'IA réussissent le mieux sur Suivi des instructions, lesquels restent fiables et où les écarts sont les plus marqués.

Modèles affichés

15

Moyenne de Score Suivi des instructions

8.0

Rang Modèle Entreprise Score Suivi des instructions Score Tests corrects Temps de réponse (moy.)
#51 Nemotron 3 Super medium NVIDIA 7.2 6.7 1/2 7.72s
#52 Grok 4.1 Fast medium X AI 6.6 6.7 1/2 5.30s
#42 Claude Sonnet 4.6 none Anthropic 6.5 7.4 1/2 1.96s
#48 Gemma 4 31B none Google 6.5 6.9 1/2 2.84s
#55 MiMo-V2-Omni none Xiaomi 6.5 6.5 1/2 4.18s
#58 GLM 5V Turbo none Z.ai 6.5 6.2 1/2 1.97s
#65 MiMo-V2-Pro none Xiaomi 6.5 6.0 1/2 2.51s
#66 GPT-5.4 none OpenAI 6.5 5.9 1/2 1.07s
#69 Kimi K2.6 none Moonshot AI 6.5 5.8 1/2 1.64s
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms
#76 Kimi K2.5 none Moonshot AI 6.5 5.5 1/2 2.67s
#77 GLM 5 Turbo none Z.ai 6.5 5.5 1/2 2.13s
#83 Mistral Small 4 none Mistral 6.5 5.2 1/2 380ms
#90 Qwen3.5-9B none Qwen 6.5 4.8 1/2 514ms
#91 Mercury 2 none Inception 6.5 4.8 1/2 551ms

Meilleurs modèles par Score Suivi des instructions

Score Suivi des instructions vs coût total

Meilleurs modèles par Temps de réponse (moy.)