AI BENCHY
Advertise here

Catégorie AI BENCHY

Classement Appel d'outils

Voyez quels modèles d'IA réussissent le mieux sur Appel d'outils, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Tests corrects ↓.

Modèles affichés

15

Moyenne de Score Appel d'outils

8.7

Rang Modèle Entreprise Score Appel d'outils Score Tests corrects Temps de réponse (moy.)
#108 Qwen3.5-Flash none Qwen 10.0 5.8 1/1 3.67s
#109 GLM 5V Turbo none Z.ai 10.0 5.8 1/1 4.86s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 1/1 3.94s
#111 Owl Alpha medium Openrouter 10.0 5.7 1/1 8.26s
#112 GLM 5.1 none Z.ai 10.0 5.7 1/1 10.7s
#113 DeepSeek V4 Pro none DeepSeek 10.0 5.7 1/1 5.92s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 10.0 5.7 1/1 4.42s
#115 Qwen3.5-27B none Qwen 10.0 5.7 1/1 3.54s
#116 Hunter Alpha none OpenRouter 10.0 5.7 1/1 6.02s
#117 Qwen3.5-35B-A3B none Qwen 10.0 5.6 1/1 2.30s
#118 Qwen3.6 27B none Qwen 9.5 5.6 1/1 6.74s
#119 Cobuddy medium Baidu 10.0 5.6 1/1 11.2s
#120 Mimo V2 PRO none Xiaomi 10.0 5.6 1/1 4.39s
#121 Owl Alpha none Openrouter 10.0 5.5 1/1 22.8s
#123 MiMo-V2.5-Pro none Xiaomi 10.0 5.5 1/1 3.30s

Meilleurs modèles par Score Appel d'outils

Score Appel d'outils vs coût total

Meilleurs modèles par Temps de réponse (moy.)