AI BENCHY Compare

Qwen: Qwen3.6 35B A3B vs xAI: Grok 4.3

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Sortie: 2026-04-20	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01

Métrique	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Sortie: 2026-04-20	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01
Score	7.8	7.8
Rang	#30	#31
Fiabilité	9.4	10.0
Cohérence	9.1	8.4
Tests corrects
Taux de réussite par tentative	70.4%	75.0%
Tests instables	2	4
Exécutions totales	60	60
Coût par résultat	1.050	4.562
Coût total	$0.126	$0.593
Prix d'entrée	$0.150 / 1M	$1.250 / 1M
Prix de sortie	$1.000 / 1M	$2.500 / 1M
Jetons de sortie	18,325	1,485
Jetons de raisonnement	115,750	214,928
Temps de réponse (moy.)	17.26s	49.23s
Temps de réponse (max)	86.11s	216.69s
Temps de réponse (total)	310.77s	984.54s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	1,154	12,385
Grok 4.3	10.0	10.0	100.0%	0		8.83s	88	8,207

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	6.6	10.0	50.0%	0		59.35s	6,601	22,535
Grok 4.3	7.4	6.5	66.7%	1		55.26s	532	24,554

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0
Grok 4.3	10.0	10.0	100.0%	0		63.99s	234	15,301

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	2,591	9,968
Grok 4.3	10.0	10.0	100.0%	0		18.97s	180	9,546

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	6,193	39,116
Grok 4.3	5.3	7.2	44.4%	1		181.74s	14	111,300

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	129	4,569
Grok 4.3	5.4	2.5	66.7%	1		24.70s	70	5,020

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	219	7,404
Grok 4.3	9.8	10.0	100.0%	0		18.58s	57	8,713

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	7.9	7.5	77.8%	1		5.98s	676	9,447
Grok 4.3	5.9	7.2	55.6%	1		22.53s	128	14,686

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0
Grok 4.3	10.0	10.0	100.0%	0		17.66s	168	4,615

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		32.90s	762	10,326
Grok 4.3	3.0	10.0	0.0%	0		44.47s	14	12,986

Comparaison rapide

Changer la paire de comparaison

Qwen3.7 MaxnonevsGrok 4.3medium Gemini 3 Flash PreviewnonevsGrok 4.3medium Gemini 3 Flash PreviewnonevsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewlowvsGrok 4.3medium Gemini 3.5 FlashminimalvsQwen3.6 35B A3Bmedium GPT-5.2 ChatnonevsGrok 4.3medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 35B A3Bmedium Gemini 3.5 FlashminimalvsGrok 4.3medium GPT-5.2 ChatnonevsQwen3.6 35B A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsGrok 4.3medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 35B A3Bmedium Gemini 3.1 Flash LitelowvsGrok 4.3medium