AI BENCHY
Advertise here

Catégorie AI BENCHY

Classement Spécifique au domaine

Voyez quels modèles d'IA réussissent le mieux sur Spécifique au domaine, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Temps de réponse (moy.) ↑.

Modèles affichés

15

Moyenne de Score Spécifique au domaine

4.8

Meilleur modèle

GLM 5 3.5
Rang Modèle Entreprise Score Spécifique au domaine Score Tests corrects Temps de réponse (moy.)
#81 Mercury 2 medium Inception 2.9 6.6 0/3 6.48s
#35 Gemini 3 PRO Preview medium Google 5.3 7.6 1/3 7.01s
#153 Qwen3.6 35B A3B none Qwen 3.5 4.6 0/3 7.45s
#16 Gemini 3 Flash Preview low Google 5.3 8.4 1/3 8.05s
#111 Owl Alpha medium Openrouter 5.3 5.7 1/3 8.58s
#51 Mimo V2 PRO medium Xiaomi 5.3 7.4 1/3 8.82s
#79 Hunter Alpha medium OpenRouter 3.0 6.7 0/3 10.5s
#20 Gemini 3.5 Flash none Google 7.6 8.1 2/3 10.6s
#107 Laguna Xs.2 medium Poolside 4.1 5.8 0/3 11.1s
#63 GPT-5.3 Chat none OpenAI 3.5 7.2 0/3 13.0s
#2 Gemini 3.5 Flash high Google 7.6 9.6 2/3 14.1s
#10 Claude Opus 4.8 medium Anthropic 5.3 8.7 1/3 14.2s
#39 Qwen3.6 Flash medium Qwen 3.5 7.5 0/3 14.6s
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 3/3 15.3s
#105 Nemotron 3 Super medium NVIDIA 2.9 5.8 0/3 16.2s

Meilleurs modèles par Score Spécifique au domaine

Score Spécifique au domaine vs coût total

Meilleurs modèles par Temps de réponse (moy.)