AI BENCHY Compare

Qwen3.6 Plus Preview vs Grok 4.20 Multi Agent Beta

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-01

Métrique	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Sortie: 2026-04-20 Disponible gratuitement	Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium Sortie: 2026-03-12

Métrique	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Sortie: 2026-04-20 Disponible gratuitement	Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium Sortie: 2026-03-12
Score	8.5	6.6
Rang	#15	#71
Fiabilité	N/D	N/D
Cohérence	10.0	7.4
Tests corrects
Taux de réussite par tentative	76.5%	63.0%
Tests instables	0	6
Exécutions totales	49	52
Coût par résultat	0.000	63.414
Coût total	$0.000	$5.074
Prix d'entrée	$0.000 / 1M	$0.000 / 1M
Prix de sortie	$0.000 / 1M	$0.000 / 1M
Jetons de sortie	1,756	299,034
Jetons de raisonnement	77,213	309,670
Temps de réponse (moy.)	13.94s	9.80s
Temps de réponse (max)	43.55s	35.28s
Temps de réponse (total)	237.01s	156.75s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557
Grok 4.20 Multi Agent Beta	6.9	5.8	75.0%	2		3.46s	33,706	33,077

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073
Grok 4.20 Multi Agent Beta	3.0	10.0	0.0%	0		0ms	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706
Grok 4.20 Multi Agent Beta	10.0	10.0	100.0%	0		5.54s	25,306	25,051

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895
Grok 4.20 Multi Agent Beta	2.9	7.2	11.1%	1		24.67s	164,609	163,647

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232
Grok 4.20 Multi Agent Beta	5.8	2.8	66.7%	1		6.40s	15,848	15,746

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552
Grok 4.20 Multi Agent Beta	9.8	10.0	100.0%	0		4.63s	25,457	25,322

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868
Grok 4.20 Multi Agent Beta	7.2	5.1	77.8%	2		5.01s	34,022	33,686

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330
Grok 4.20 Multi Agent Beta	3.0	10.0	0.0%	0		0ms	0	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Plus Preview	-	-	-	-	-	-	-	-
Grok 4.20 Multi Agent Beta	10.0	10.0	100.0%	0		27.11s	86	13,141

Comparaison rapide

Changer la paire de comparaison

Qwen3.6 Plus PreviewmediumDisponible gratuitementvsHY3 PreviewhighDisponible gratuitement Qwen3.6 Plus PreviewmediumDisponible gratuitementvsHY3 PreviewlowDisponible gratuitement Gemini 3 Flash PreviewnonevsQwen3.6 Plus PreviewmediumDisponible gratuitement Gemini 3 Flash PreviewlowvsQwen3.6 Plus PreviewmediumDisponible gratuitement Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plus PreviewmediumDisponible gratuitement GPT-5.2 ChatnonevsQwen3.6 Plus PreviewmediumDisponible gratuitement Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Plus PreviewmediumDisponible gratuitement GPT-5.5lowvsQwen3.6 Plus PreviewmediumDisponible gratuitement GPT-5.3 ChatnonevsQwen3.6 Plus PreviewmediumDisponible gratuitement DeepSeek V4 FlashhighvsQwen3.6 Plus PreviewmediumDisponible gratuitement Claude Opus 4.7nonevsQwen3.6 Plus PreviewmediumDisponible gratuitement Claude Sonnet 4.6nonevsQwen3.6 Plus PreviewmediumDisponible gratuitement