Qwen3.7 Plus vs Grok 4.20 (medium)

Modèle recommandé Qwen3.7 Plus

Il obtient le meilleur score ici (7.2) tout en coûtant environ 7.3x moins que Grok 4.20 (medium).

Comparaison détaillée

Métrique	Qwen3.7 Plus Qwen3.7 Plus none Sortie: 2026-06-03	Grok 4.20 Grok 4.20 medium Sortie: 2026-03-31

Métrique	Qwen3.7 Plus Qwen3.7 Plus none Sortie: 2026-06-03	Grok 4.20 Grok 4.20 medium Sortie: 2026-03-31
Score	7.2	7.1
Rang	#81	#85
Fiabilité	10.0	10.0
Cohérence	10.0	8.5
Tests corrects
Taux de réussite par tentative	50.0%	63.6%
Tests instables	0	4
Exécutions totales	66	66
Coût par résultat	1.014	9.709
Coût total	$0.106	$0.777
Prix d'entrée	$0.320 / 1M	$1.250 / 1M
Prix de sortie	$1.280 / 1M	$2.500 / 1M
Total des jetons d'entrée	98,824	102,791
Jetons de sortie	58,097	5,363
Jetons de raisonnement	0	253,977
Temps de réponse (moy.)	12.09s	29.47s
Temps de réponse (max)	206.03s	199.66s
Temps de réponse (total)	265.89s	648.35s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Catégorie:

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
Grok 4.20	8.7	6.9	83.3%	1		42.25s	71,267	3,776	44,009

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442

Changer la paire de comparaison