Comparer Graphiques Méthodologie

Langue:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-35B-A3B

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique	OpenAI: GPT-5.4 none Sortie: 2026-03-05	Qwen: Qwen3.5-35B-A3B medium Sortie: 2026-02-24
Score moy.	4.6	5.8
Rang	#45	#34
Tests corrects
Cohérence	8.9	6.7
Coût par résultat	1.496	4.189
Coût total	$0.090	$0.336
Taux de réussite par tentative	44.4%	80.0%
Tests instables	2	6
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Jetons de sortie	1,635	5,475
Jetons de raisonnement	0	165,513
Temps de réponse (moy.)	1.46s	44.84s
Temps de réponse (max)	2.89s	106.00s
Temps de réponse (total)	21.86s	672.55s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.75s	429	36,235

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Qwen: Qwen3.5-35B-A3B	10.0	1.6	66.7%	1		75.34s	775	12,485

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Qwen: Qwen3.5-35B-A3B	5.5	5.9	83.3%	1		59.33s	235	19,493

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Qwen: Qwen3.5-35B-A3B	10.0	4.4	44.5%	2		88.34s	41	46,368

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Qwen: Qwen3.5-35B-A3B	4.0	4.4	77.8%	2		31.58s	3,589	32,206

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Comparaison rapide

Changer la paire de comparaison

Qwen3.5-35B-A3BmediumvsGLM 5none MiniMax M2.5mediumvsGPT-5.4none Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Mercury 2mediumvsGPT-5.4none Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium Gemini 3 Flash PreviewnonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneDisponible gratuitementvsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-35B-A3Bmedium GPT-4o-mininonevsQwen3.5-35B-A3Bmedium