Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Max vs Z.ai: GLM 5

Résumé

Comparaison benchmark Qwen3.7 Max vs GLM 5 : Qwen3.7 Max mène au score moyen avec 9.4 vs 8.6. GLM 5 a le coût de benchmark le plus bas avec $0.228 vs $0.523. Qwen3.7 Max est plus rapide avec 16.02s vs 33.54s, avec des taux de réussite de 88.9% vs 82.5%.

Modèle recommandé: Qwen3.7 Max - Il obtient le meilleur score ici (9.4) et répond environ 2.1x plus vite que GLM 5.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique Qwen3.7 Max Qwen3.7 Max medium Sortie: 2026-05-22 GLM 5 GLM 5 medium Sortie: 2026-02-12
Score 9.4 8.6
Rang #4 #18
Fiabilité 10.0 10.0
Cohérence 9.6 8.5
Tests corrects
Taux de réussite par tentative 88.9% 82.5%
Tests instables 1 4
Exécutions totales 63 63
Coût par résultat 5.517 1.668
Coût total $0.523 $0.228
Prix d'entrée $1.250 / 1M $0.600 / 1M
Prix de sortie $3.750 / 1M $1.920 / 1M
Total des jetons d'entrée 42,360 35,224
Jetons de sortie 2,129 21,570
Jetons de raisonnement 122,959 102,996
Temps de réponse (moy.) 16.02s 33.54s
Temps de réponse (max) 59.98s 99.85s
Temps de réponse (total) 336.51s 435.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 Qwen3.7 Max

medium
Cost
$0.017
Time
68.8s
Tokens
4,526 tok

#18 GLM 5

medium
Cost
$0.005
Time
20.7s
Tokens
2,068 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 672 222 8,742
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 35.31s 7,893 423 34,808
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 14,934 366 8,405
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 7,782 270 6,254
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 771 61 31,793
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 516 135 4,457
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 699 102 5,452
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 696 259 8,908
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 8,193 267 1,220
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 204 24 12,920
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

Comparaison rapide

Changer la paire de comparaison