Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Z.ai: GLM 4.7 Flash

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-12

Métrique Grok 4.20 Beta Grok 4.20 Beta none Sortie: 2026-03-12 GLM 4.7 Flash GLM 4.7 Flash medium Sortie: 2026-01-19
Rang #52 #62
Score moy. 4.4 3.1
Cohérence 9.1 6.4
Coût par résultat 2.214 1.040
Coût total $0.089 $0.042
Tests corrects
Taux de réussite par tentative 33.3% 41.7%
Tests instables 2 7
Exécutions totales 48 48
Jetons de sortie 1,511 38,682
Jetons de raisonnement 0 64,952
Temps de réponse (moy.) 1.22s 36.84s
Temps de réponse (max) 6.48s 174.55s
Temps de réponse (total) 19.53s 331.58s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Total des jetons de sortie

Score moy. vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 3.3 7.9 22.2% 1 562ms 245 0
GLM 4.7 Flash 4.0 4.5 55.6% 2 27.09s 1,085 5,597
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 10.0 10.0 0.0% 0 6.48s 282 0
GLM 4.7 Flash 10.0 2.1 33.3% 1 65.57s 2,585 20,648
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 9.9 10.0 100.0% 0 601ms 197 0
GLM 4.7 Flash 5.0 10.0 50.0% 0 1.51s 584 2,755
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 10.0 10.0 0.0% 0 611ms 160 0
GLM 4.7 Flash 10.0 4.4 33.3% 2 174.55s 33,000 25,394
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
GLM 4.7 Flash 10.0 9.7 0.0% 0 18.14s 18 2,138
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 4.5 10.0 0.0% 0 687ms 60 0
GLM 4.7 Flash 5.0 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 4.0 7.2 55.6% 1 541ms 291 0
GLM 4.7 Flash 10.0 7.2 11.1% 1 12.90s 798 5,225
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

Comparaison rapide

Changer la paire de comparaison