AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs xAI: Grok 4.3

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-22

Métrique	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Sortie: 2026-02-15	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01

Métrique	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Sortie: 2026-02-15	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01
Score	8.1	7.8
Rang	#21	#33
Fiabilité	10.0	10.0
Cohérence	8.8	8.4
Tests corrects
Taux de réussite par tentative	76.7%	75.0%
Tests instables	3	4
Exécutions totales	60	60
Coût par résultat	2.259	4.562
Coût total	$0.317	$0.593
Prix d'entrée	$0.260 / 1M	$1.250 / 1M
Prix de sortie	$1.560 / 1M	$2.500 / 1M
Jetons de sortie	2,184	1,485
Jetons de raisonnement	173,206	214,928
Temps de réponse (moy.)	67.90s	49.23s
Temps de réponse (max)	266.69s	216.69s
Temps de réponse (total)	882.70s	984.54s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236
Grok 4.3	10.0	10.0	100.0%	0		8.83s	88	8,207

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	7.6	6.7	66.7%	1		193.80s	406	63,554
Grok 4.3	7.4	6.5	66.7%	1		55.26s	532	24,554

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906
Grok 4.3	10.0	10.0	100.0%	0		63.99s	234	15,301

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916
Grok 4.3	10.0	10.0	100.0%	0		18.97s	180	9,546

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680
Grok 4.3	5.3	7.2	44.4%	1		181.74s	14	111,300

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675
Grok 4.3	5.4	2.5	66.7%	1		24.70s	70	5,020

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704
Grok 4.3	9.8	10.0	100.0%	0		18.58s	57	8,713

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		34.57s	340	14,496
Grok 4.3	5.9	7.2	55.6%	1		22.53s	128	14,686

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909
Grok 4.3	10.0	10.0	100.0%	0		17.66s	168	4,615

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	24	17,130
Grok 4.3	3.0	10.0	0.0%	0		44.47s	14	12,986

Comparaison rapide

Changer la paire de comparaison

Gemini 3.5 FlashminimalvsQwen3.5 Plus 2026-02-15medium Qwen3.7 MaxnonevsGrok 4.3medium Gemini 3 Flash PreviewnonevsGrok 4.3medium Gemini 3.1 Flash Lite PreviewlowvsGrok 4.3medium GPT-5.2 ChatnonevsGrok 4.3medium Gemini 3.5 FlashminimalvsGrok 4.3medium Gemini 3.1 Flash Lite PreviewnonevsGrok 4.3medium Gemini 3.1 Flash LitelowvsGrok 4.3medium GPT-5.3 ChatnonevsGrok 4.3medium DeepSeek V4 FlashhighDisponible gratuitementvsGrok 4.3medium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium