Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Z.ai: GLM 5 Turbo

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-08

Métrique GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05 GLM 5 Turbo GLM 5 Turbo medium Sortie: 2026-03-15
Score 8.2 8.1
Rang #13 #20
Fiabilité 10.0 6.7
Cohérence 8.3 8.4
Tests corrects
Taux de réussite par tentative 80.7% 77.2%
Tests instables 4 4
Exécutions totales 57 57
Coût par résultat 4.594 1.438
Coût total $0.598 $0.187
Prix d'entrée $1.750 / 1M $1.200 / 1M
Prix de sortie $14.000 / 1M $4.000 / 1M
Jetons de sortie 2,309 12,217
Jetons de raisonnement 36,880 40,252
Temps de réponse (moy.) 15.33s 18.85s
Temps de réponse (max) 100.93s 194.23s
Temps de réponse (total) 291.34s 358.15s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
GLM 5 Turbo 10.0 10.0 100.0% 0 12.26s 332 3,301
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
GLM 5 Turbo 8.7 7.9 77.8% 1 5.44s 315 2,702
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 20 1,319

Comparaison rapide

Changer la paire de comparaison