AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Sortie: 2026-02-15

Métrique	GPT-5.3-Codex GPT-5.3-Codex medium Sortie: 2026-02-05	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Sortie: 2026-02-15
Score	8.3	8.1
Rang	#15	#20
Fiabilité	10.0	10.0
Cohérence	8.4	8.8
Tests corrects
Taux de réussite par tentative	81.7%	76.7%
Tests instables	4	3
Exécutions totales	60	60
Coût par résultat	4.891	2.259
Coût total	$0.685	$0.317
Prix d'entrée	$1.750 / 1M	$0.260 / 1M
Prix de sortie	$14.000 / 1M	$1.560 / 1M
Jetons de sortie	2,332	2,184
Jetons de raisonnement	42,616	173,206
Temps de réponse (moy.)	15.97s	67.90s
Temps de réponse (max)	100.93s	266.69s
Temps de réponse (total)	319.30s	882.70s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	10.0	10.0	100.0%	0		18.45s	514	7,266
Qwen3.5 Plus 2026-02-15	7.6	6.7	66.7%	1		193.80s	406	63,554

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		34.57s	340	14,496

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	30	1,701
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	24	17,130

Comparaison rapide

Changer la paire de comparaison

Gemini 3.5 FlashminimalvsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Gemini 3.5 FlashminimalvsGPT-5.3-Codexmedium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-02-15medium GPT-5.3-CodexmediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium GPT-5.2 ChatnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.5 FlashnonevsGPT-5.3-Codexmedium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash LitelowvsQwen3.5 Plus 2026-02-15medium GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium