Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Z.ai: GLM 4.7 Flash

Résumé

Comparaison benchmark GPT-5.4 Mini vs GLM 4.7 Flash : GPT-5.4 Mini mène au score moyen avec 5.3 vs 4.3. GPT-5.4 Mini a le coût de benchmark le plus bas avec $0.038 vs $0.054. GPT-5.4 Mini est plus rapide avec 1.13s vs 35.10s, avec des taux de réussite de 30.2% vs 33.3%.

Modèle recommandé: GPT-5.4 Mini - Il obtient le meilleur score ici (5.3) et répond environ 30.9x plus vite que GLM 4.7 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique GPT-5.4 Mini GPT-5.4 Mini none Sortie: 2026-03-17 GLM 4.7 Flash GLM 4.7 Flash medium Sortie: 2026-01-19
Score 5.3 4.3
Rang #131 #159
Fiabilité 10.0 6.7
Cohérence 8.8 6.8
Tests corrects
Taux de réussite par tentative 30.2% 33.3%
Tests instables 3 8
Exécutions totales 63 63
Coût par résultat 0.743 1.337
Coût total $0.038 $0.054
Prix d'entrée $0.750 / 1M $0.060 / 1M
Prix de sortie $4.500 / 1M $0.400 / 1M
Total des jetons d'entrée 34,244 37,206
Jetons de sortie 2,541 43,754
Jetons de raisonnement 0 89,079
Temps de réponse (moy.) 1.13s 35.10s
Temps de réponse (max) 2.52s 174.55s
Temps de réponse (total) 23.82s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

Comparaison rapide

Changer la paire de comparaison