AI BENCHY Compare

OpenAI: gpt-oss-120b vs Z.ai: GLM 5.1

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement	GLM 5.1 GLM 5.1 none Sortie: 2026-04-07

Métrique	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement	GLM 5.1 GLM 5.1 none Sortie: 2026-04-07
Score	5.2	5.6
Rang	#129	#113
Fiabilité	10.0	10.0
Cohérence	8.7	8.1
Tests corrects
Taux de réussite par tentative	36.8%	40.0%
Tests instables	3	5
Exécutions totales	57	60
Coût par résultat	0.201	0.941
Coût total	$0.011	$0.057
Prix d'entrée	$0.000 / 1M	$0.980 / 1M
Prix de sortie	$0.000 / 1M	$3.080 / 1M
Jetons de sortie	51,505	3,749
Jetons de raisonnement	0	0
Temps de réponse (moy.)	21.86s	4.16s
Temps de réponse (max)	113.71s	32.57s
Temps de réponse (total)	349.78s	83.23s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0
GLM 5.1	4.0	6.3	25.0%	2		2.11s	305	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
GLM 5.1	4.3	9.5	0.0%	0		6.33s	519	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
GLM 5.1	2.8	2.1	33.3%	1		32.57s	2,129	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
GLM 5.1	10.0	10.0	100.0%	0		1.08s	204	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
GLM 5.1	2.9	7.2	11.1%	1		1.99s	24	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0
GLM 5.1	5.0	10.0	0.0%	0		790ms	39	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	9.8	10.0	100.0%	0		5.10s	1,982	0
GLM 5.1	9.8	10.0	100.0%	0		1.58s	66	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	4.4	4.5	44.5%	2		9.51s	3,781	0
GLM 5.1	6.1	7.8	44.4%	1		1.48s	152	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
GLM 5.1	10.0	10.0	100.0%	0		10.68s	300	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0
GLM 5.1	3.0	10.0	0.0%	0		2.34s	11	0

Comparaison rapide

Changer la paire de comparaison

gpt-oss-120bmediumDisponible gratuitementvsGLM 5.1none MiniMax M2.5mediumDisponible gratuitementvsGLM 5.1none MiniMax M2.7mediumvsgpt-oss-120bnoneDisponible gratuitement CobuddymediumDisponible gratuitementvsGLM 5.1none Mistral Small 4mediumvsGLM 5.1none gpt-oss-120bnoneDisponible gratuitementvsElephant Alphamedium Elephant AlphamediumvsGLM 5.1none Mistral Small 4mediumvsgpt-oss-120bnoneDisponible gratuitement MiniMax M2.5mediumDisponible gratuitementvsgpt-oss-120bnoneDisponible gratuitement Owl AlphamediumvsGLM 5.1none Nemotron 3 SupermediumDisponible gratuitementvsGLM 5.1none gpt-oss-120bnoneDisponible gratuitementvsQwen3 Coder Nextmedium