AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Catégorie AI BENCHY

Classement Appel d'outils

Voyez quels modèles d'IA réussissent le mieux sur Appel d'outils, lesquels restent fiables et où les écarts sont les plus marqués. Trier par: Métrique ↑.

Modèles affichés

15

Moyenne de Score Appel d'outils

8.7

Meilleur modèle

Grok 4.1 Fast 2.8
Rang Modèle Entreprise Score Appel d'outils Score Tests corrects Temps de réponse (moy.)
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 10.0 6.0 1/1 2.99s
#105 Nemotron 3 Super medium NVIDIA 10.0 5.8 1/1 39.7s
#106 Grok 4.20 Beta none X AI 10.0 5.8 1/1 4.79s
#108 Qwen3.5-Flash none Qwen 10.0 5.8 1/1 3.67s
#109 GLM 5V Turbo none Z.ai 10.0 5.8 1/1 4.86s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 1/1 3.94s
#111 Owl Alpha medium Openrouter 10.0 5.7 1/1 8.26s
#112 GLM 5.1 none Z.ai 10.0 5.7 1/1 10.7s
#113 DeepSeek V4 Pro none DeepSeek 10.0 5.7 1/1 5.92s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 10.0 5.7 1/1 4.42s
#115 Qwen3.5-27B none Qwen 10.0 5.7 1/1 3.54s
#116 Hunter Alpha none OpenRouter 10.0 5.7 1/1 6.02s
#117 Qwen3.5-35B-A3B none Qwen 10.0 5.6 1/1 2.30s
#119 Cobuddy medium Baidu 10.0 5.6 1/1 11.2s
#120 Mimo V2 PRO none Xiaomi 10.0 5.6 1/1 4.39s

Meilleurs modèles par Score Appel d'outils

Score Appel d'outils vs coût total

Meilleurs modèles par Temps de réponse (moy.)