AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.7 Max

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	GPT-5.5 GPT-5.5 medium Sortie: 2026-04-24	Qwen3.7 Max Qwen3.7 Max none Sortie: 2026-05-22

Métrique	GPT-5.5 GPT-5.5 medium Sortie: 2026-04-24	Qwen3.7 Max Qwen3.7 Max none Sortie: 2026-05-22
Score	8.7	7.9
Rang	#11	#26
Fiabilité	10.0	10.0
Cohérence	8.8	10.0
Tests corrects
Taux de réussite par tentative	86.7%	70.0%
Tests instables	3	0
Exécutions totales	60	60
Coût par résultat	21.891	0.719
Coût total	$3.503	$0.101
Prix d'entrée	$5.000 / 1M	$2.500 / 1M
Prix de sortie	$30.000 / 1M	$7.500 / 1M
Jetons de sortie	1,973	1,988
Jetons de raisonnement	109,510	0
Temps de réponse (moy.)	37.89s	1.30s
Temps de réponse (max)	332.10s	3.92s
Temps de réponse (total)	757.71s	25.95s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	242	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	8.2	6.7	83.3%	1		69.68s	341	19,515
Qwen3.7 Max	6.8	10.0	50.0%	0		1.39s	576	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841
Qwen3.7 Max	3.0	10.0	0.0%	0		2.17s	171	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	243	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	15	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	120	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	72	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		6.78s	250	2,254
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	314	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	222	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.5	2.8	1.6	33.3%	1		37.86s	30	1,754
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	13	0

Comparaison rapide

Changer la paire de comparaison

GPT-5.4mediumvsQwen3.7 Maxnone Qwen3.7 MaxnonevsGLM 5 Turbomedium Gemini 3.5 FlashminimalvsQwen3.7 Maxnone Gemma 4 31BmediumDisponible gratuitementvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsGPT-5.5medium Qwen3.7 MaxnonevsGrok 4.3medium Seed-2.0-LitemediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Maxnone Gemini 3.5 FlashnonevsGPT-5.5medium Gemini 3.1 Flash LitemediumvsQwen3.7 Maxnone Gemini 2.5 FlashmediumvsQwen3.7 Maxnone Gemini 3 PRO PreviewmediumvsQwen3.7 Maxnone