Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 vs Z.ai: GLM 5V Turbo

Résumé

Comparaison benchmark Grok 4.20 vs GLM 5V Turbo : Grok 4.20 mène au score moyen avec 7.3 vs 7.3. GLM 5V Turbo a le coût de benchmark le plus bas avec $0.457 vs $0.609. GLM 5V Turbo est plus rapide avec 23.08s vs 27.68s, avec des taux de réussite de 63.5% vs 68.3%.

Modèle recommandé: GLM 5V Turbo - Il offre le meilleur compromis global: score compétitif (7.3), coût inférieur à Grok 4.20 et temps de réponse équilibré.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique Grok 4.20 Grok 4.20 medium Sortie: 2026-03-31 GLM 5V Turbo GLM 5V Turbo medium Sortie: 2026-04-01
Score 7.3 7.3
Rang #53 #56
Fiabilité 10.0 10.0
Cohérence 8.8 7.9
Tests corrects
Taux de réussite par tentative 63.5% 68.3%
Tests instables 3 6
Exécutions totales 63 63
Coût par résultat 8.309 4.151
Coût total $0.609 $0.457
Prix d'entrée $1.250 / 1M $1.200 / 1M
Prix de sortie $2.500 / 1M $4.000 / 1M
Total des jetons d'entrée 44,433 44,615
Jetons de sortie 1,819 2,347
Jetons de raisonnement 219,524 98,415
Temps de réponse (moy.) 27.68s 23.08s
Temps de réponse (max) 199.66s 95.88s
Temps de réponse (total) 581.26s 484.63s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium
Coût
$0.041
Temps
110.3s
Tokens
16,336 tok

#56 GLM 5V Turbo

medium
SVG invalide
Coût
$0.000
Temps
300.0s
Tokens
0 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
GLM 5V Turbo 7.2 6.1 75.0% 2 10.76s 555 587 7,872
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
GLM 5V Turbo 6.0 7.2 55.6% 1 63.38s 7,256 440 37,873
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
GLM 5V Turbo 6.9 3.8 66.7% 1 15.06s 18,533 403 2,523
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
GLM 5V Turbo 10.0 10.0 100.0% 0 9.60s 7,107 236 4,333
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
GLM 5V Turbo 5.3 7.2 44.4% 1 38.15s 687 32 29,035
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
GLM 5V Turbo 10.0 10.0 100.0% 0 11.09s 477 131 2,183
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
GLM 5V Turbo 9.9 10.0 100.0% 0 3.74s 636 72 1,813
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
GLM 5V Turbo 7.7 10.0 66.7% 0 10.24s 609 131 4,496
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
GLM 5V Turbo 7.0 3.7 66.7% 1 12.53s 8,569 293 765
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442
GLM 5V Turbo 3.0 10.0 0.0% 0 40.96s 186 22 7,522

Comparaison rapide

Changer la paire de comparaison