AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Z.ai: GLM 5.1

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	GLM 5.1 GLM 5.1 none Sortie: 2026-04-07

Métrique	DeepSeek V4 Pro DeepSeek V4 Pro none Sortie: 2026-04-24	GLM 5.1 GLM 5.1 none Sortie: 2026-04-07
Score	6.0	5.6
Rang	#95	#113
Fiabilité	8.1	10.0
Cohérence	8.9	8.1
Tests corrects
Taux de réussite par tentative	48.3%	40.0%
Tests instables	3	5
Exécutions totales	60	60
Coût par résultat	0.564	0.941
Coût total	$0.046	$0.057
Prix d'entrée	$0.435 / 1M	$0.980 / 1M
Prix de sortie	$0.870 / 1M	$3.080 / 1M
Jetons de sortie	5,347	3,749
Jetons de raisonnement	0	0
Temps de réponse (moy.)	13.48s	4.16s
Temps de réponse (max)	58.65s	32.57s
Temps de réponse (total)	269.56s	83.23s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.5	8.0	16.7%	1		14.02s	704	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	305	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.4	6.8	33.3%	1		8.27s	527	0
GLM 5.1	4.3	9.5	0.0%	0		6.33s	519	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	9.5	10.0	100.0%	0		25.49s	1,911	0
GLM 5.1	2.8	2.1	33.3%	1		32.57s	2,129	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	8.8	10.0	100.0%	0		30.54s	170	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	204	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.17s	18	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	24	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	4.3	9.9	0.0%	0		3.75s	132	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	39	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	6.3	10.0	50.0%	0		8.23s	64	0
GLM 5.1	9.8	10.0	100.0%	0		1.58s	66	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	7.6	7.2	77.8%	1		19.72s	175	0
GLM 5.1	6.1	7.8	44.4%	1		1.48s	152	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	10.0	10.0	100.0%	0		5.92s	219	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	300	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V4 Pro	3.0	10.0	0.0%	0		15.59s	1,427	0
GLM 5.1	3.0	10.0	0.0%	0		2.34s	11	0

Comparaison rapide

Changer la paire de comparaison

gpt-oss-120bmediumDisponible gratuitementvsGLM 5.1none DeepSeek V4 PrononevsGPT-5 Nanomedium DeepSeek V4 PrononevsNemotron 3 SupermediumDisponible gratuitement MiniMax M2.5mediumDisponible gratuitementvsGLM 5.1none CobuddymediumDisponible gratuitementvsGLM 5.1none Mistral Small 4mediumvsGLM 5.1none DeepSeek V4 PrononevsOwl Alphamedium Elephant AlphamediumvsGLM 5.1none DeepSeek V4 PrononevsMercury 2medium Owl AlphamediumvsGLM 5.1none CobuddymediumDisponible gratuitementvsDeepSeek V4 Pronone Nemotron 3 SupermediumDisponible gratuitementvsGLM 5.1none