Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique	OpenAI: GPT-5.4 none Sortie: 2026-03-05	Qwen: Qwen3 Coder Next medium Sortie: 2026-02-03
Rang	#44	#51
Score moy.	46	33
Cohérence	89	95
Coût par résultat	1.496	0.224
Coût total	$0.090	$0.007
Temps de réponse (moy.)	1.46s	13.77s
Temps de réponse (max)	2.89s	81.80s
Temps de réponse (total)	21.86s	123.93s
Tests corrects
Taux de réussite par tentative	44.4%	24.4%
Tests instables	2	1
Jetons de sortie	1,635	2,793
Jetons de raisonnement	0	0

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	100	73	11.1%	1		1.41s	388	0
Qwen: Qwen3 Coder Next	13	75	22.2%	1		15.28s	1,246	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	100	100	0.0%	0		2.89s	291	0
Qwen: Qwen3 Coder Next	100	100	0.0%	0		4.28s	317	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	99	100	100.0%	0		1.04s	222	0
Qwen: Qwen3 Coder Next	54	100	50.0%	0		81.80s	246	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	40	72	44.4%	1		1.07s	50	0
Qwen: Qwen3 Coder Next	40	100	33.3%	0		638ms	25	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	55	100	50.0%	0		1.07s	81	0
Qwen: Qwen3 Coder Next	45	100	0.0%	0		7.34s	63	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	40	98	33.3%	0		1.52s	357	0
Qwen: Qwen3 Coder Next	100	100	0.0%	0		2.30s	641	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
OpenAI: GPT-5.4	100	100	100.0%	0		2.75s	246	0
Qwen: Qwen3 Coder Next	100	100	100.0%	0		2.64s	255	0

Comparaison rapide

Changer la paire de comparaison

Mercury 2nonevsQwen3 Coder Nextmedium MiniMax M2.5mediumvsGPT-5.4none Qwen3 Coder NextmediumvsGrok 4.1 Fastnone Kimi K2.5nonevsQwen3 Coder Nextmedium Qwen3 Coder NextmediumvsMiMo-V2-Flashnone Qwen3 Coder NextmediumvsGLM 4.7 Flashnone LFM2-24B-A2BnonevsQwen3 Coder Nextmedium GPT-4o-mininonevsQwen3 Coder Nextmedium Mercury 2mediumvsGPT-5.4none Trinity Large Preview (free)noneDisponible gratuitementvsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsGLM 4.7 Flashmedium