AI BENCHY Compare

Qwen: Qwen3.6 27B vs Grok 4.1 Fast

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	Qwen3.6 27B Qwen3.6 27B medium Sortie: 2026-04-20	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19

Métrique	Qwen3.6 27B Qwen3.6 27B medium Sortie: 2026-04-20	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19
Score	6.6	6.5
Rang	#83	#87
Fiabilité	9.9	10.0
Cohérence	8.1	7.3
Tests corrects
Taux de réussite par tentative	58.3%	61.4%
Tests instables	5	6
Exécutions totales	60	57
Coût par résultat	3.015	0.644
Coût total	$0.272	$0.058
Prix d'entrée	$0.317 / 1M	$0.000 / 1M
Prix de sortie	$3.200 / 1M	$0.000 / 1M
Jetons de sortie	13,007	2,025
Jetons de raisonnement	105,697	96,679
Temps de réponse (moy.)	57.65s	24.01s
Temps de réponse (max)	168.22s	121.79s
Temps de réponse (total)	1153.04s	288.18s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	582	4,311
Grok 4.1 Fast	8.7	7.9	91.7%	1		3.81s	108	4,741

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	6.6	10.0	50.0%	0		165.39s	4,760	26,668
Grok 4.1 Fast	2.3	1.1	33.3%	1		23.58s	821	6,703

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	2,088	14,689
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	568	9,404
Grok 4.1 Fast	10.0	10.0	100.0%	0		6.63s	180	5,409

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	3,510	20,352
Grok 4.1 Fast	5.8	4.4	66.7%	2		121.79s	11	37,657

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	81	3,045
Grok 4.1 Fast	4.2	9.9	0.0%	0		16.25s	127	3,456

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	346	6,548
Grok 4.1 Fast	6.5	10.0	50.0%	0		5.30s	55	3,489

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	7.7	10.0	66.7%	0		60.21s	281	11,919
Grok 4.1 Fast	5.3	7.2	44.4%	1		8.08s	187	6,086

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	390	2,954
Grok 4.1 Fast	2.8	1.6	33.3%	1		27.71s	260	11,485

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	401	5,807
Grok 4.1 Fast	3.0	10.0	0.0%	0		25.52s	15	5,381

Comparaison rapide

Changer la paire de comparaison

Qwen3.6 27BmediumvsGrok Build 0.1none Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium GPT-5.5nonevsQwen3.6 27Bmedium DeepSeek V4 ProhighvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Gemma 4 31BnoneDisponible gratuitementvsQwen3.6 27Bmedium Qwen3.6 27BmediumvsGLM 5none Gemma 4 26B A4BnoneDisponible gratuitementvsQwen3.6 27Bmedium Gemini 2.5 FlashnonevsQwen3.6 27Bmedium Qwen3.6 27BmediumvsMiMo-V2-Omninone Claude Sonnet 4.6nonevsQwen3.6 27Bmedium DeepSeek V4 PrononevsQwen3.6 27Bmedium