AI BENCHY Compare

Qwen: Qwen3.7 Plus vs Z.ai: GLM 5V Turbo

Résumé

Comparaison benchmark Qwen3.7 Plus vs GLM 5V Turbo : Qwen3.7 Plus mène au score moyen avec 7.2 vs 5.9. Qwen3.7 Plus a le coût de benchmark le plus bas avec $0.023 vs $0.052. Qwen3.7 Plus est plus rapide avec 2.85s vs 2.99s, avec des taux de réussite de 47.6% vs 38.1%.

Modèle recommandé: Qwen3.7 Plus - Il obtient le meilleur score ici (7.2) tout en coûtant environ 2.3x moins que GLM 5V Turbo.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	Qwen3.7 Plus Qwen3.7 Plus none Sortie: 2026-06-03	GLM 5V Turbo GLM 5V Turbo none Sortie: 2026-04-01

Métrique	Qwen3.7 Plus Qwen3.7 Plus none Sortie: 2026-06-03	GLM 5V Turbo GLM 5V Turbo none Sortie: 2026-04-01
Score	7.2	5.9
Rang	#60	#105
Fiabilité	10.0	10.0
Cohérence	10.0	10.0
Tests corrects
Taux de réussite par tentative	47.6%	38.1%
Tests instables	0	0
Exécutions totales	63	63
Coût par résultat	0.276	0.645
Coût total	$0.023	$0.052
Prix d'entrée	$0.320 / 1M	$1.200 / 1M
Prix de sortie	$1.280 / 1M	$4.000 / 1M
Total des jetons d'entrée	42,510	37,100
Jetons de sortie	6,578	1,766
Jetons de raisonnement	0	0
Temps de réponse (moy.)	2.85s	2.99s
Temps de réponse (max)	29.38s	6.51s
Temps de réponse (total)	59.86s	62.74s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#60 Qwen3.7 Plus

none

Coût: $0.019
Temps: 213.5s
Tokens: 11,960 tok

#105 GLM 5V Turbo

none

Coût: $0.042
Temps: 177.3s
Tokens: 10,434 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
GLM 5V Turbo	4.8	10.0	25.0%	0		3.13s	555	281	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
GLM 5V Turbo	5.5	10.0	33.3%	0		3.13s	7,256	360	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0
GLM 5V Turbo	3.0	10.0	0.0%	0		6.51s	12,708	276	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
GLM 5V Turbo	10.0	10.0	100.0%	0		3.81s	7,107	204	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.09s	687	24	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
GLM 5V Turbo	4.6	10.0	0.0%	0		2.22s	477	114	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
GLM 5V Turbo	6.5	10.0	50.0%	0		1.97s	636	60	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
GLM 5V Turbo	5.3	10.0	33.3%	0		2.40s	609	210	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
GLM 5V Turbo	10.0	10.0	100.0%	0		4.86s	6,879	222	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
GLM 5V Turbo	3.0	10.0	0.0%	0		2.23s	186	15	0

Comparaison rapide

Changer la paire de comparaison

Gemma 4 26B A4BmediumDisponible gratuitementvsQwen3.7 Plusnone Qwen3.7 PlusnonevsStep 3.7 Flashhigh Qwen3.7 PlusnonevsGLM 5.1medium Kimi K2.7 CodemediumvsQwen3.7 Plusnone Qwen3.7 PlusnonevsGrok 4.20medium Gemini 3 Flash PreviewlowvsQwen3.7 Plusnone Qwen3.7 PlusnonevsMiMo-V2.5-Promedium Seed-2.0-MinimediumvsQwen3.7 Plusnone DeepSeek V3.2mediumvsQwen3.7 Plusnone Gemini 3.5 FlashminimalvsQwen3.7 Plusnone GPT-5.4 NanomediumvsQwen3.7 Plusnone Ring-2.6-1TmediumvsQwen3.7 Plusnone