Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

xAI: Grok 4.20 Multi-Agent Beta vs Z.ai: GLM 5 Turbo

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-15

Métrique Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium Sortie: 2026-03-12 GLM 5 Turbo GLM 5 Turbo none Sortie: 2026-03-15
Rang #47 #53
Score 6.0 5.7
Cohérence 7.1 9.5
Coût par résultat 97.178 0.467
Coût total $4.859 $0.028
Tests corrects
Taux de réussite par tentative 52.1% 39.6%
Tests instables 6 1
Exécutions totales 48 48
Jetons de sortie 293,634 1,264
Jetons de raisonnement 291,260 0
Temps de réponse (moy.) 9.08s 2.92s
Temps de réponse (max) 35.28s 8.21s
Temps de réponse (total) 127.09s 46.72s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 5.8 4.4 66.7% 2 3.77s 28,392 27,808
GLM 5 Turbo 3.0 10.0 0.0% 0 3.01s 376 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5 Turbo 3.0 10.0 0.0% 0 4.89s 144 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
GLM 5 Turbo 10.0 10.0 100.0% 0 2.47s 204 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
GLM 5 Turbo 5.3 10.0 33.3% 0 1.97s 25 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
GLM 5 Turbo 4.2 9.9 0.0% 0 2.18s 48 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
GLM 5 Turbo 6.5 10.0 50.0% 0 2.13s 65 0
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
GLM 5 Turbo 5.5 7.4 44.4% 1 2.43s 180 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
GLM 5 Turbo 10.0 10.0 100.0% 0 8.21s 222 0

Comparaison rapide

Changer la paire de comparaison