AI BENCHY Compare

Qwen: Qwen3.5-27B vs xAI: Grok 4.1 Fast

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-14

Métrique	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19

Métrique	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19
Score	5.9	6.7
Rang	#64	#49
Cohérence	9.2	7.2
Tests corrects
Taux de réussite par tentative	38.9%	64.8%
Tests instables	2	6
Exécutions totales	54	54
Coût par résultat	0.265	0.613
Coût total	$0.016	$0.056
Prix d'entrée	$0.195 / 1M	$0.200 / 1M
Prix de sortie	$1.560 / 1M	$0.500 / 1M
Jetons de sortie	3,545	2,010
Jetons de raisonnement	0	91,298
Temps de réponse (moy.)	1.74s	23.88s
Temps de réponse (max)	9.39s	121.79s
Temps de réponse (total)	31.32s	262.66s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	267	0
Grok 4.1 Fast	8.7	7.9	91.7%	1		3.81s	108	4,741

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	10.0	10.0	100.0%	0		2.51s	381	0
Grok 4.1 Fast	2.3	1.1	33.3%	1		23.58s	821	6,703

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	1,461	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	243	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		6.63s	180	5,409

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	15	0
Grok 4.1 Fast	5.8	4.4	66.7%	2		121.79s	11	37,657

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	126	0
Grok 4.1 Fast	4.2	9.9	0.0%	0		16.25s	127	3,456

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	4.8	10.0	0.0%	0		815ms	69	0
Grok 4.1 Fast	6.6	10.0	50.0%	0		5.30s	55	3,489

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	6.7	7.9	55.6%	1		1.37s	680	0
Grok 4.1 Fast	5.3	7.2	44.4%	1		8.08s	187	6,086

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0
Grok 4.1 Fast	2.8	1.6	33.3%	1		27.71s	260	11,485

Comparaison rapide

Changer la paire de comparaison

Grok 4.1 FastmediumvsGLM 5none gpt-oss-120bmediumDisponible gratuitementvsQwen3.5-27Bnone Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium MiniMax M2.5mediumDisponible gratuitementvsQwen3.5-27Bnone Grok 4.1 FastmediumvsMiMo-V2-Omninone Gemma 4 31BnoneDisponible gratuitementvsGrok 4.1 Fastmedium Mistral Small 4mediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-27Bnone Grok 4.1 FastmediumvsGLM 5V Turbonone Qwen3.5-FlashnonevsGrok 4.1 Fastmedium Gemma 4 26B A4BnoneDisponible gratuitementvsGrok 4.1 Fastmedium Seed-2.0-LitenonevsGrok 4.1 Fastmedium