AI BENCHY
Advertise here

Catégorie AI BENCHY

Classement Spécifique au domaine

Voyez quels modèles d'IA réussissent le mieux sur Spécifique au domaine, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Métrique ↑.

Modèles affichés

15

Moyenne de Score Spécifique au domaine

4.8

Meilleur modèle

GLM 5 Turbo 2.9
Rang Modèle Entreprise Score Spécifique au domaine Score Tests corrects Temps de réponse (moy.)
#81 Mercury 2 medium Inception 2.9 6.6 0/3 6.48s
#84 Grok 4.20 Multi Agent Beta medium X AI 2.9 6.6 0/3 24.7s
#87 Gemini 3.1 Flash Lite minimal Google 2.9 6.4 0/3 1.02s
#90 Gemini 3.1 Flash Lite none Google 2.9 6.4 0/3 762ms
#91 GPT-5.5 none OpenAI 2.9 6.4 0/3 1.31s
#103 DeepSeek V4 Pro high DeepSeek 2.9 6.0 0/3 205.7s
#112 GLM 5.1 none Z.ai 2.9 5.7 0/3 1.99s
#133 DeepSeek V3.2 none DeepSeek 2.9 5.2 0/3 4.17s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 2.9 4.6 0/3 56.7s
#40 Gemini 3.1 Flash Lite Preview medium Google 3.0 7.5 0/3 4.21s
#69 Claude Opus 4.6 medium Anthropic 3.0 7.0 0/3 83.4s
#73 Seed-2.0-Mini medium Bytedance Seed 3.0 6.9 0/3 0ms
#79 Hunter Alpha medium OpenRouter 3.0 6.7 0/3 10.5s
#80 Mimo V2 Omni medium Xiaomi 3.0 6.7 0/3 47.9s
#88 Qwen3.7 Plus none Qwen 3.0 6.4 0/3 868ms

Meilleurs modèles par Score Spécifique au domaine

Score Spécifique au domaine vs coût total

Meilleurs modèles par Temps de réponse (moy.)