Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Z.ai: GLM 4.7 Flash

Résumé

Comparaison benchmark DeepSeek V3.2 vs GLM 4.7 Flash : DeepSeek V3.2 mène au score moyen avec 5.3 vs 4.3. DeepSeek V3.2 a le coût de benchmark le plus bas avec $0.017 vs $0.054. DeepSeek V3.2 est plus rapide avec 13.83s vs 35.10s, avec des taux de réussite de 39.7% vs 33.3%.

Modèle recommandé: DeepSeek V3.2 - Il obtient le meilleur score ici (5.3) tout en coûtant environ 3.2x moins que GLM 4.7 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01 GLM 4.7 Flash GLM 4.7 Flash medium Sortie: 2026-01-19
Score 5.3 4.3
Rang #133 #159
Fiabilité 10.0 6.7
Cohérence 7.6 6.8
Tests corrects
Taux de réussite par tentative 39.7% 33.3%
Tests instables 6 8
Exécutions totales 63 63
Coût par résultat 0.306 1.337
Coût total $0.017 $0.054
Prix d'entrée $0.229 / 1M $0.060 / 1M
Prix de sortie $0.344 / 1M $0.400 / 1M
Total des jetons d'entrée 55,997 37,206
Jetons de sortie 11,165 43,754
Jetons de raisonnement 0 89,079
Temps de réponse (moy.) 13.83s 35.10s
Temps de réponse (max) 115.89s 174.55s
Temps de réponse (total) 290.43s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#133 DeepSeek V3.2

none
Cost
$0.002
Time
7.0s
Tokens
1,046 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

Comparaison rapide

Changer la paire de comparaison